摘要:近日,山东农业大学信息学院张亮团队与农学院王宏伟教授在International Journal of Biological Macromolecules上发表了题为“MF-ProtDisMap: protein real-valued distance pr
近日,山东农业大学信息学院张亮团队与农学院王宏伟教授在International Journal of Biological Macromolecules上发表了题为“MF-ProtDisMap: protein real-valued distance prediction with fusion of sequence and coevolutionary features”的研究论文。山东农业大学张亮教授和王宏伟教授为该论文的共同通讯作者,山东农业大学硕士张宇菲与厦门大学硕士钟苏阳为该论文共同第一作者,山东农业大学为第一通讯单位。
蛋白质结构的精确解析是理解生物微观分子机制、基因精准设计的基础。尽管AlphaFold2在蛋白质结构预测方面取得了显著成果,但如何进一步优化关键功能区域(如酶的活性位点、蛋白-配体结合界面)及独立结构域的预测精度,仍是当前学界关注的核心问题与研究焦点。残基间实值距离预测不仅为解决上述问题提供了高分辨率的几何约束,还能直观反映其内部相互作用与空间组织,从而使模型预测结果具有更强的可解释性。
团队基于ESM与MSA Transformer两个大模型构建了MF-ProtDisMap大模型框架,该框架通过三项核心设计实现了性能提升:其一,双通道特征提取模块同时捕捉蛋白质序列特征与共进化语义信息;
图1 MF-ProtDisMap网络架构
其二,“group pooling”策略实现高效的特征降维与融合;其三,Diff-former特征学习模块结合三角注意力机制与扩散模型以强化残基间关系建模。在蛋白质实值距离预测任务中,MF-ProtDisMap的MAE和RMSE分别为2.20Å和3.40Å,优于ESMFold的2.56Å和5.38Å。此外,在接触预测任务的验证中,该模型的ROC值为84.56%,PR值为81.01%,均超过了现有最佳方法。鉴于缺乏能够直接从实值距离预测重建蛋白质结构的可用工具,团队开发了ProtDisFold,用于距离约束结构建模,并成功重建了祖先植物α/β-水解酶(PDB ID:7ukb)、Fhb7-GST和植物NLR Sr35的三级结构。本研究将助力作物改良精准设计、基于冷冻电镜刻画微观结构等领域发展。
图2 α/β-水解酶、Fhb7-GST和NLR Sr35的3D结构模型
该研究得到了国家重点研发计划项目、国家自然科学基金、山东省自然科学基金的资助。
论文链接:
来源:科学美匠