Science | 新模型人类蛋白质组水平预测互作

B站影视 电影资讯 2025-09-28 01:17 1

摘要:一项近日发表在Science的工作开发新模型-RF2-PPI,结合深度的多序列比对(从30Pb基因组数据筛选超2万物种解析其蛋白编码相关信息[1]),“蒸馏”的互作训练(主要用AF2模型的互作结构域(domain)来训练)以及高效的架构(轻量化的RoseTTA

一项近日发表在Science的工作开发新模型-RF2-PPI,结合深度的多序列比对(从30Pb基因组数据筛选超2万物种解析其蛋白编码相关信息[1]),“蒸馏”的互作训练(主要用AF2模型的互作结构域(domain)来训练)以及高效的架构(轻量化的RoseTTAFold (RF)[2])实现了人类蛋白质组水平的互作预测[3]。

主要基于该模型,研究人员从近两亿的人类蛋白对中预测17,849对高度可信的互作蛋白,其中3,631对从没被相关数据库收集过,从而扩展了人们对人类蛋白互作网络的认知,并带来一系列潜在与疾病关联的互作有待于进一步实验解析[3]。

结合海量的基因组数据强化共演化信息[3]。

RF2-PPI概览[3]。

RF2-PPI预测GPCR等的互作蛋白,以及蛋白复合物里面的新组分[3]。

该项工作的通讯作者是西南医学中心的Qian Cong;2025年9月25日在线发表在Science[3]。

Comment(s):

充分利用了基因组资源,在蛋白编码注释上估计还有进一步的提升空间。

另外,该项工作结合“阴性对照”,也就是没有证据可以互作的蛋白对,潜在缓解了假阳性之类问题;不过这种主要基于Domain的训练会减低对复杂互作界面的预测能力。

参考文献:

[1] “Home - SRA - NCBI.” https://www.ncbi.nlm.nih.gov/sra (accessed Sep. 28, 2025).

[2] M. Baek et al., “Accurate prediction of protein structures and interactions using a three-track neural network.,” Science, vol. 373, no. 6557, pp. 871–876, Aug. 2021, doi: 10.1126/science.abj8754.

[3] J. Zhang et al., “Predicting protein-protein interactions in the human proteome,” Science (80-. )., vol. 0, no. 0, p. eadt1630, Sep. 2025, doi: 10.1126/science.adt1630.

原文链接:

来源:科学大硬盘

相关推荐