院况简介
1949年,伴随着新中国的诞生,中国科学院成立。
作为国家在科学技术方面的最高学术机构和全国自然科学与高新技术的综合研究与发展中心,建院以来,中国科学院时刻牢记使命,与科学共进,与祖国同行,以国家富强、人民幸福为己任,人才辈出,硕果累累,为我国科技进步、经济社会发展和国家安全做出了不可替代的重要贡献。 更多简介 +
院领导集体
创新单元
科技奖励
科技期刊
工作动态/ 更多
中国科学院学部
中国科学院院部
语音播报
近日,美国华盛顿大学和英国DeepMind公司分别公布了多年工作的成果:先进的建模程序,可以预测蛋白质和一些分子复合物的精确三维原子结构。其中一个研究小组报告说,他们已经使用最新开发的人工智能(AI)程序预测了来自人类和20种模式生物的35万种蛋白质结构——如大肠杆菌、酵母和果蝇。未来几个月里,他们计划将所有已编目的蛋白质列入模型蛋白质名单,大约有1亿个分子。
“这是相当惊人的。”美国马里兰大学蛋白质专家John Moult说,他每两年举办一次名为“关键的蛋白质结构预测方法”(CASP)的比赛。Moult表示,几十年来,结构生物学家一直梦想有一天,计算机模型能增加从X射线晶体学等实验方法中获得的极精确蛋白质形状的数量。“我从没想过这个梦想会成真。”Moult说。
这一名为AlphaFold的模型是DeepMind公司研究人员的成果,DeepMind是一家隶属于谷歌母公司Alphabet的英国AI公司。2020年,AlphaFold“横扫”了CASP。但是DeepMind研究人员没有透露绘制蛋白质形状的理论细节,特别是AlphaFold的底层计算机代码。
这种情况已开始改变。7月15日,华盛顿大学的Minkyung Baek和David Baker研究小组报告说,他们创建了一个名为RoseTTAFold的高度精确的蛋白质结构预测程序,并公开发布了该程序。相关成果在线发表于《科学》。与此同时,《自然》发表了一篇由DeepMind研究人员Demis Hassabis和John Jumper撰写的论文,公布了AlphaFold的细节。
两个程序都使用AI在庞大的蛋白质结构数据库中识别折叠模式。这些程序通过考虑蛋白质中相邻氨基酸相互作用的基本物理和生物学规则,计算出未知蛋白质最可能的结构。论文显示,Baek和Baker使用RoseTTAFold创建了一个包含数百个G蛋白偶联受体(一类常见的药物靶点)的结构数据库。
而DeepMind研究人员创造了35万个预测结构,是以前实验方法得到的结果的两倍多。研究人员表示,AlphaFold产生了近44%的人类蛋白质结构,涵盖了人类基因组编码的近60%的氨基酸。AlphaFold确定许多其他人类蛋白质是“无序的”,这意味着它们的形状不是单一结构。
此外,DeepMind与欧洲分子生物学实验室合作共建了一个新的蛋白质预测数据库,可以在网上免费访问。“能提供这种服务真是太棒了。” Baker说,“这真的会加快研究步伐。”因为蛋白质的3D结构在很大程度上决定了它的功能,所以这一数据库便于生物学家厘清数千种未知蛋白质是如何工作的。
相关论文信息:https://doi.org/10.1126/science.abj8754
https://doi.org/10.1038/s41586-021-03828-1
扫一扫在手机打开当前页
© 1996 - 2025 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
© 1996 - 2025 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
© 1996 - 2025 中国科学院 版权所有
京ICP备05002857号-1京公网安备110402500047号
网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话:86 10 68597114(总机)
86 10 68597289(总值班室)