摘要:论文第一作者孔祥哲来自清华大学计算机系自然语言处理与社会人文计算实验室(TsinghuaNLP),导师为刘洋老师。目前研究方向主要在利用几何深度学习进行基于结构的药物分子设计。
编辑 | ScienceAI
本文作者分别来自清华大学、人民大学高瓴人工智能学院,和字节跳动 AI 制药团队。
论文第一作者孔祥哲来自清华大学计算机系自然语言处理与社会人文计算实验室(TsinghuaNLP),导师为刘洋老师。目前研究方向主要在利用几何深度学习进行基于结构的药物分子设计。
在药物研发中,针对不同靶点特性和疾病机制需要采用差异化的分子设计策略。小分子凭借其优异的药代动力学性质和细胞渗透性,成为靶向细胞内蛋白和口服药物的首选;多肽分子则填补了小分子与生物制剂之间的空白,其延展性结合界面可有效调控传统小分子难以靶向的蛋白-蛋白相互作用等相对大而平坦的界面;而抗体凭借超高特异性和亲和力,在需要精确识别的治疗领域(癌症、自免等疾病)占据主导地位。
然而,当前的计算生成方法仍受限于单一分子领域:小分子领域基于原子的自回归或扩散模型无法推广至更大体系的分子设计(如抗体);而抗体生成框架通常为氨基酸表征做了特化,缺乏向其他分子类型的扩展能力。
当然,Alphafold 3等结构预测的模型已经显示了不同类型的分子进行统一建模可以大幅提升结构预测的准确性。同样的,在基于靶点的药物分子设计上,统一建模也能带来很多好处。
从实际应用的角度来说,统一建模可以为同一个靶点探索不同的分子类型,以适配不同的医疗需求(口服、穿膜等);从机器学习的角度来说,不同分子间享有类似的设计原理,即所有结合分子都遵循相同的分子结合规律(如氢键网络、疏水作用互补)和几何约束(键长、键角等),统一建模可以利用更多已有的数据,训练更大、泛化性更强的模型。
该论文提出的 UniMoMo 是首个统一小分子、多肽和抗体设计的生成模型。通过构建层级化的模块(block)表示和等变隐空间扩散方法,该框架突破了传统领域界限,同时保持了原子级的生成精度。UniMoMo 在多类分子任务基准的评测中均实现领先表现,展示了跨模态知识迁移与数据共享的巨大潜力。
论文标题:UniMoMo: Unified Generative Modeling of 3D molecules for De NovoBinder Design
论文地址:
Github地址:
1、如何进行统一建模?
为了同时保留原子级几何精度以及捕捉不同种类分子结构的层次性,UniMoMo 创新性地提出了两阶段解决方案。
以 block 层次化全原子表示
UniMoMo 将各类分子统一表示为以分子片段(block)作为节点构成的图结构,其中每个 block 对应标准氨基酸或经主子图算法提取的小分子片段(如苯环、吲哚)。这种表示既保留了原子级坐标信息(每个 block 包含完整原子类型与三维坐标),又通过 block 级别的抽象实现了结构层次化,有效地衔接了纯原子粒度表示以及为氨基酸特化的表示之间的鸿沟,在维持计算复杂度和可扩展性的基础上,保留了原子粒度的几何特征。
全原子迭代变分自编码器(Iterative Full-Atom VAE)
隐空间扩散模型(Latent Diffusion)
全原子 VAE 定义了连续且定长的 block-level 的隐状态节点,使得各种迭代式生成算法(diffusion、flow matching 等)可以直接在隐空间上应用来进行生成。实际的实验中,研究者使用二次复杂度的 E(3)-等变 transformer 实例化去噪网络,直接使用标准的 DDPM 即可得到不错的效果。全原子 VAE+block-level diffusion 的思路巧妙规避了传统扩散模型无法处理变长数据的难题,同时利用隐空间降维显著提升计算效率。Diffusion 的过程主要聚焦于 block 的全局空间排布,而 VAE 则注重于局部细粒度的原子重建,实现了高效性与原子级准确性的统一。
2、统一建模是否真的有用?
为全面评估 UniMoMo 的统一建模能力,研究团队在三大分子类型(小分子、多肽、抗体)的结构设计任务中进行了系统性验证。实验设计采用双重对比策略:一方面与各领域最优单类型模型对标,另一方面比较统一训练(all)与单域训练(single)的模型变体,以验证跨域知识迁移的有效性。
多肽设计性能突破
在 PepBench 测试集上,UniMoMo 展现出显著的几何建模优势。相较最优基线 PepGLAD,在结构恢复程度上 UniMoMo 有大幅的性能提升,复合物 RMSD 从 2.74 Å 降至 2.19Å,配体自身 RMSD 从 1.60 Å 降至1.27Å。 Rosetta 界面能(-34.35 kcal/mol)比最优基线(-23.12 kcal/mol)相对提升 49%,在40.86% 的靶点上能生成优于天然结合多肽的新结合多肽。
而在主链/侧链二面角 JSD(0.205/0.180)上,UniMoMo也是大幅优于最好的基线结果(0.240/0.398),说明UniMoMo能生成更偏向天然结构的全原子多肽结构。并且,UniMoMo(all)相比单肽版本在各项指标上均有大幅提升,验证了抗体/小分子数据对生成多肽的几何构象以及交互界面的优化作用。
抗体 CDR 设计优势
在 RAbD 测试集上,UniMoMo 的百次采样性能同样展示了其优越的生成能力。在序列和结构的恢复率上,UniMoMo 的 CDR-H3 的 AAR(52.34%)和 RMSD(1.04Å)相比 DiffAb 均有大幅优化。而在 65% 的靶点上,UniMoMo 均能生成出结合强度超越天然 CDR 的结果。除此之外,UniMoMo 生成结构的主链和侧链二面角也更接近天然结构的分布。统一训练使 H3 的序列恢复率提升了约 4%,结构 RMSD 降低了 25%,主链和侧链二面角分布 JSD 分别降低 19% 和 22%,证实多肽和小分子数据有助于改善抗体 CDR 的构象采样。
小分子 CBGBench结果
在小分子生成任务中,UniMoMo同样展现了优越的性能。通过在 CrossDocked2020 数据集上的评估,作者发现 UniMoMo 在基于 CBGBench 的综合评价上超越了现有主流方法。
具体而言,UniMoMo 在子结构分布(原子种类、官能团等)、化学性质合理性(QED、LogP、SA 等)、几何结构质量(键长/角度分布与原子冲突率等)以及相互作用得分(Vina docking)等方面均取得了更高的综合评分(完整的实验结果请查看原文)。
尤为重要的是,与仅在小分子数据上训练的单域版本相比,跨分子类型训练的 UniMoMo(all) 在所有评估维度上均有显著提升。这表明,即便是在分子结构构成最为灵活、类型最为多样的小分子场景中,统一模型依然能够从其他分子类型中迁移几何规律与相互作用模式,进而提升小分子的单体构象和相对口袋空间布局的合理性。
这一现象再次验证了 UniMoMo 的核心理念:不同分子之间的几何约束和结合机制具有可共享的模式,统一建模可以有效激发这一潜力。
统一建模的协同效应
三类任务的性能增益呈现显著规律性:跨域训练的 UniMoMo(all)相比单域版本在核心指标上均有大幅提升,且优势随分子数据稀缺性(抗体>肽>小分子)递增。
这一现象揭示了分子设计的底层统一性:不同分子类型共享局部几何约束(如芳环平面性)和界面作用模式(如氢键网络构建),而统一建模通过隐空间全局性的知识共享,以及原子粒度局部性的知识共享,实现了跨尺度的规律迁移。实验结果不仅验证了 UniMoMo 的技术创新性和有效性,更为构建通用型分子生成系统提供了实证基础。
3、GPCR 案例研究
研究者进一步以 G 蛋白偶联受体(GPCR,PDB 8U4R)为靶点,系统验证了 UniMoMo 在单一结合位点上实现多肽、抗体和小分子协同设计的能力。实验结果显示,UniMoMo 生成的各类分子均展现出优异的结合特性,体现在不错的 Rosetta ΔG,Vina score 分布。
深入分析发现,UniMoMo 展现出独特的结构仿生设计能力。比如模拟天然氨基酸的侧链与靶点残基形成关键的相互作用,或是借鉴多肽和抗体中的酰胺键连接骨架,形成整体较大的分子来填充较大的口袋。模型能将蛋白质-蛋白质相互作用的关键模式转化为小分子药效团,实现相互作用模式的跨模态迁移;能精准转化不同分子类型的局部构象特征,使小分子能根据口袋大小自适应地调整分子大小。
这种突破性的跨模态设计能力,为开发针对复杂靶点的多模态药物组合提供了全新的技术路径。
4、未来展望
尽管 UniMoMo 在统一分子生成领域取得了重要突破,其技术框架仍为未来的深入探索提供了广阔空间。在分子覆盖范围方面,当前工作主要基于标准氨基酸和常见分子片段,而进一步拓展至非天然氨基酸、翻译后修饰多肽/抗体(如磷酸化、糖基化变体)以及复杂环状分子等结构,将显著增强模型在更广泛药物化学空间中的适用性。
这种扩展不仅能够覆盖更多样化的候选分子类型,还可能揭示不同结构域间新的构效关系。统一建模的理念也为模型的可控性和可解释性研究提供了契机,有望进一步推进生成模型向更可信、更实用的分子设计平台发展。
总之,UniMoMo 的提出不仅为分子设计任务提供了一个通用而强大的生成框架,也为 AI 驱动的药物发现打开了一个充满潜力的新方向。
来源:科学你我他