我们的细胞再向下一级究竟有什么?细胞核、线粒体、内质网、高尔基体…… 在中学生物课里我们知道了这些,然而它们就是亚细胞结构的全部吗?绝对不是!
加州大学圣地亚哥分校(UCSD)医学院的研究人员和合作者们,通过 AI 技术分析出了人类肾脏细胞的 70 种亚系统,发现其中有一半都是人类未知的。
这项研究登上了最新一期的 Nature。
肾细胞中一半成分未知
科学家研究细胞内部的结构主要使用两种技术:荧光显微镜成像和生物物理关联。
第一种方法是用荧光物质标定蛋白质,并在显微镜范围内跟踪它们的运动和关联。由此科学家们得到了人类蛋白质图谱(HPA)数据。
生物物理关联,是使用一种特定的抗体将蛋白质从细胞中拉出来,分析蛋白质上结合着什么。现在,科学家们已经有了 BioPlex 这一数据库。UCSD 的研究者们,就是将 HPA 与 BioPlex 中的蛋白质数据集合到一起,然后输入到深度神经网络中。AI 会对蛋白质之间的“距离”进行计算分析,最后得到多尺度整合细胞图谱(MuSIC Map)。
多年来,UCSD 团队一直对绘制细胞内部工作图感兴趣。MuSIC 的不同之处在于使用深度学习直接从细胞显微镜图像绘制细胞图谱。
此前,他们构建了一种叫做 DCell 的神经网络,并且用酿酒酵母细胞作为基础研究模型。他们用所有关于细胞生物学和细胞层次的知识库,来训练这个标准 AI 算法。DCell 可以根据基因突变的信息,预测细胞可能发生的行为,结果与实验室里的细胞行为几乎一致。
MuSIC 也是一种神经网络,与 DCell 的不同之处在于,它是细胞显微镜图像到亚细胞结构的映射。该团队已经将 MuSIC 的代码开源。
通过 MuSIC,研究人员发现了一组蛋白质形成一种过去不熟悉的结构,最终确定该结构是结合 RNA 的蛋白质新复合体,该复合体可能涉及染色质的剪接。
未来将扩展到所有人体细胞
搞清楚亚细胞结构对于发现疾病病因有重要的意义,因为大多数疾病都可以归结于细胞的哪个部分出了故障。例如,肿瘤之所以能够生长,是因为基因没能准确转化为特定蛋白质;代谢疾病是因为线粒体没能正常工作。但要了解在疾病中细胞的哪些部位出了故障,科学家首先需要一份完整的亚细胞结构清单。
这篇论文的通讯作者 Trey Ideker 教授指出,这是一项测试 MuSIC 技术的试点研究,他们只研究了 661 种蛋白质和一种细胞类型。
△ Trey Ideker 教授的实验室团队
Ideker 还表示,他们的下一步是研究整个人类细胞,然后再扩展到不同的细胞类型、人和物种。最终,通过比较健康和病变细胞之间的区别,更好地了解许多疾病的分子基础。
参考链接:
[1]https://ucsdnews.ucsd.edu/pressrelease/we-might-not-know-half-of-whats-in-our-cells-new-ai-technique-reveals
[2]https://www.nature.com/articles/s41586-021-04115-9
[3]https://idekerlab.ucsd.edu/music/
[4]https://github.com/idekerlab/MuSIC
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。