摘要:蛋白质-蛋白质相互作用(PPIs)是生命活动的基础,解析蛋白质复合物结构对理解生物功能、研发药物极为关键。当下,主流的计算预测方法,如 AlphaFold-Multimer(AFM)、AlphaFold3(AF3),在复杂复合物及动态互作场景中的准确性欠佳;交
蛋白质-蛋白质相互作用(PPIs)是生命活动的基础,解析蛋白质复合物结构对理解生物功能、研发药物极为关键。当下,主流的计算预测方法,如 AlphaFold-Multimer(AFM)、AlphaFold3(AF3),在复杂复合物及动态互作场景中的准确性欠佳;交联质谱(XL-MS)、共价标记(CL)等实验技术虽能提供结构线索,但缺乏通用、灵活且有效的整合工具。如何利用多源实验数据增强AI模型能力、提升蛋白复合物结构预测精度,成为该领域亟待攻克的难题。
2025年9月15日,昌平实验室、北京大学高毅勤教授与刘思睿研究员团队在Nature Methods发表发表题为 “Integrating diverse experimental information to assist protein complex structure prediction by GRASP” 的研究论文,提出通用的约束辅助结构预测模型GRASP(Generalized Restraints Assisted Structure Predictor)。该模型能够灵活整合不同类型和数量的约束信息,从而显著提升蛋白复合物结构预测的精度。研究团队在模拟和真实实验数据中验证了GRASP的准确性,并成功将其应用于抗原–抗体复合物结构预测、多源实验信息整合建模以及线粒体原位结构解析等场景,为结构生物学研究提供了一种全新的有力工具。
首先,研究团队在 AlphaFold-Multimer(AFM)的基础上提出了 GRASP 框架,一个通用的约束辅助预测方法(图1)。该框架原生支持两类约束:残基对约束(RPR),如来自 XL-MS 或 NMR 的两个残基之间的距离信息,以及界面约束(IR),如共价标记(CL)、化学位移扰动(CSP)或深度突变扫描(DMS)提供的界面残基位点。两类约束被整合到相对位置编码、Evoformer 和 IPA模块中。研究团队从AFM和自行从头训练的MEGAFold-Multimer参数权重出发,在训练阶段模拟约束并引入约束相关损失项进行微调;推理阶段引入迭代噪声过滤策略以降低错误约束的影响。为提高稳健性,作者采用来自不同训练阶段和来源的五个检查点进行集成预测,并结合 pLDDT 与约束召回率的综合评分选择最佳模型。
图1. GRASP框架示意图
紧接着,研究团队在多种模拟与真实数据上系统验证了 GRASP 的准确性。首先,在自建的高难度基准集上,GRASP在不同数目的两类约束效果优于其他工具。当仅提供少量约束时,GRASP 就能显著提升预测精度,并在界面质量和物理合理性上接近实验结构。这些改进源于外部约束的有效利用,而非单纯模型微调。在模拟化学交联数据中,GRASP 在不同覆盖率和噪声条件下均表现出优势;在单一类型真实实验数据(包括 XL、CL 和 CSP)中,GRASP 同样优于现有方法,且在处理错误约束时展现出良好的鲁棒性。
随后,研究团队展示了 GRASP 在抗原‑抗体复合物预测这一公认难题中的表现。结果表明,GRASP在模拟或真实的DMS、XL、CSP约束条件下均显著优于现有方法,能够在缺乏共进化信号的情况下准确识别结合界面,并有效利用稀疏实验信息提升预测精度。此外,研究团队提出将 GRASP与AF3 结合的策略,通过在 AF3 预测不符合实验约束时切换至 GRASP 重建,进一步提高整体成功率,显示出两者互补的潜力。
最后,研究团队展示了 GRASP 在多源实验信息整合和原位结构预测中的应用。对复杂、大型复合物而言,结合交联质谱、冷冻电镜等多种实验信息的整合建模(integrative modeling)方法是获得其结构的重要手段。为提升方法在整合建模任务中的通用性,团队开发了 Combfit电镜密度图建模工具,使 GRASP 能够间接利用电子密度图信息,并在多个用例上进行了评估。结果表明,GRASP 能够将交联质谱、突变数据、低分辨率 cryo-EM 电镜密度图等多种约束统一整合,成功解析了多个复杂体系的结构,并在界面构象和约束满足率上优于传统方法。
此外,GRASP 还为原位化学交联质谱方法获得的原位蛋白相互作用组提供了有效的建模工具,在基于原位化学交联质谱数据(in situ XL-MS)的线粒体蛋白互作结构建模中表现出色,能够在大规模互作预测中保持高精度,并揭示潜在的瞬时相互作用,显示出在复杂生物环境下的广泛适用性。
在后AF时代,如何充分应用实验信息实现AI增强、推动干湿实验技术的协同发展成为计算与实验科学家关注的一类重要问题。GRASP实现了对多种实验信息的整合,在多种实验场景(XL‑MS、CL、CSP、DMS)中显著提升复合物结构预测,尤其在抗原‑抗体预测、多源整合建模和原位PPI重建中表现突出,为结构生物学研究提供了有力工具。当前的局限在于仅直接支持能够转化为残基对或界面信息的实验信息形式,对电子密度图等信号仍依赖 Combfit 间接转化,未来可探索对 cryo‑EM、SAXS、cryo‑ET 等数据的直接整合。为便于复现与应用,作者已开源评测数据和模型权重,发布完整代码,并提供可直接运行的 Colab Notebook,用户可快速接入自身实验约束,一键完成结构预测。
北京大学、昌平实验室的高毅勤(Yi Qin Gao)教授和昌平实验室刘思睿(Sirui Liu)研究员为本文的通讯作者,昌平实验室-北京大学联合培养博士生谢豫豪(Yuhao Xie)和北京大学博士生张成伟(Chengwei Zhang)为本文的共同第一作者。
学术合作组织
战略合作伙伴
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
来源:小鹏聊科学