摘要:今天给大家讲一篇2025年9月在nature machine intelligence上发表的一篇关于分子生成方面的文章。传统的分子设计方法(如高通量筛选)依赖于活性化合物库,无法针对特定靶点进行分子设计。因此,作者设计了一种用于靶向药物设计的生成模型Drug
今天给大家讲一篇2025年9月在nature machine intelligence上发表的一篇关于分子生成方面的文章。传统的分子设计方法(如高通量筛选)依赖于活性化合物库,无法针对特定靶点进行分子设计。因此,作者设计了一种用于靶向药物设计的生成模型DrugGEN,通过大规模类药化合物与靶点特异性生物活性分子数据集训练以生成与特定疾病靶点结合的小分子药物。实验结果表明DrugGEN已成功为多种癌症关键激酶AKT1设计了候选抑制剂,在体外酶活实验也进一步表明部分合成的新分子对AKT1有显著抑制活性。此外,生成的分子-靶点相互作用注意力图谱也为理解模型的决策提供了可解释性分析。该工作展示了DrugGEN在靶向分子设计方面的潜力,在一定程度上加速新型靶点候选分子发现,推动了人工智能在药物设计中的发展。
药物研发是一个长期且高成本的过程,其主要目的是针对特定生物分子靶点筛选具有生物活性的化合物。尽管高通量筛选技术已实现单次数万化合物的并行测试,但由于化学空间与靶点空间的规模极其庞大,现有技术仍无法覆盖全部空间,因此难以发现最优候选分子。此外,要靶向当前未被充分覆盖的蛋白家族,需提升小分子结构多样性,然而现有化合物库的筛选结果仍多样性不足;其次,多数候选分子因毒性或疗效不足在临床试验后期被终止,成为药物研发成功率低的主要原因。尽管现在基于人工智能的分子生成方法虽能优化分子性质,但却难以满足“以靶点为中心”的理性药物设计需求。因此,发展人工智能驱动的靶向从头药物设计,是突破传统研发瓶颈、实现精准靶向治疗的关键路径。
2.1 DrugGEN的技术实现框架
现有分子生成模型的架构难以有效捕捉分子内原子间的长程依赖关系,导致生成分子结构或空间构象不合理。此外,大部分方法未整合靶点的结构信息,导致生成分子与特定靶点的亲和力不佳。因此,作者设计了一种基于图注意力网络的靶点条件生成模型(DrugGEN),该方法直接建模分子图中原子间的长程依赖关系,这样可以精准捕捉三维空间构象与拓扑结构,确保生成分子的结构合理性,并且还将目标蛋白的结合位点特征作为条件输入生成器,引导分子生成过程以期提升生成分子与特定靶点的亲和力。在训练过程中,将同时学习小分子的 物理化学性质和拓扑属性以确保生成分子符合药物设计规则,并通过对抗训练的方式使其生成分子逼近真实活性配体的分布。最终, 该模型结合高效采样算法与分子动力学模拟进行验证,不仅在一定程度上提高了体外活性验证的通过率,更首次实现了AI生成分子从虚拟设计到实验落地的端到端设计,大幅缩短了候选药物的发现周期(图1)。
图1 DrugGEN的具体应用
3.1 基于靶点生成分子的质量评估
作者将DrugGEN模型在两个不同癌症靶点(即AKT1和CDK2)上进行了训练和测试,以评估其跨不同蛋白生成分子的质量。通过多维度对比分析,实验首先评估了生成分子与靶蛋白的结合能力, 相较于RELATION等主流模型,DrugGEN在AKT1靶点上取得了最优的对接得分。在CDK2靶点上,DrugGEN的结合亲和力显著优于TargetDiff,并与当前表现最优的Pocket2Mol模型相当,这展现了其能够适应不同靶点的结合口袋几何形状和化学环境并生成高质量的分子的能力。
此外,该方法生成的分子在类药性、可合成性等筛选指标上均表现出较优的性能,其物理化学性质分布更接近专用药物分子数据库,并且还能够生成40个在结合分数上优于已进入临床试验的AKT1抑制剂Capivasertib的分子,展现出潜在的临床开发价值(图2)。
图2 不同模型生成分子的对接分数分布图
3.2 活性分子筛选实验
为了进一步评估DrugGEN生成分子的靶向结合能力,作者首先构建了一个基于靶点结构的生物活性预测模型DEEPScreen(图3),并利用该模型对DrugGEN生成的10,000个新分子进行筛选。结果发现有748个分子被高置信度地预测为AKT1活性分子。
此外,通过与随机化合物库挑选出的1,0000分子和非靶向生成模型设计的的1,0000分子的对照试验表明DrugGEN生成高活性分子的数量分别达到相应对照组的6倍和10倍以上,这一点同样也证明了DrugGEN在高效设计靶向分子方面的优势。
图3 DEEPScreen设计架构
3.3 AKT1 抑制剂设计的湿实验验证
基于前期计算分析结果,作者从生成的分子中筛选出30个候选分子。为了兼顾实验成本与验证效率,还进行了深度评估,即综合考虑了分子对接得分、DEEPScreen预测的活性概率、合成成本的经济性等多个因素后,还进一步从中挑选出5个结构多样的分子进行合成。随后通过放射性标记激酶实验进行体外活性检测,结果显示有两个化合物表现出明确抑制活性。由此可见该方法成功实现了从虚拟设计到实验验证的闭环,证实了其能够生成具有生物活性分子的能力(图4)。
图4 AKT1 抑制剂设计
传统分子生成方法大部分基于图神经网络架构,然而该架构对于小分子的化学键类型、空间构象等信息的表征提取能力不佳。此外,其他主流方法(如GraphVAE、JT-VAE)训练时缺乏靶点的结构信息使得生成分子质量不高。因此,作者设计了以靶点为中心的分子生成方法(DrugGEN),该方法的核心在于将生成对抗网络与Transformer的架构相融合,通过巧妙地改变了Transformer中的注意力机制,使其更有效地整合分子边的信息,从而增强了分子结构表征的提取能力。在对AKT1和CDT2蛋白的靶向性实验表明,DrugGEN生成的分子在理化性质和结构特征方面与AKT1抑制剂较为相似,其中两个合成分子在体外酶活实验中活性较优。该方法有效地缩短了整个基于靶点的候选分子筛选到验证的整个流程的时间,为人工智能驱动的药物发现提供了高效解决方案。
参考文献
Ünlü A, Çevrim E, Yiğit M G, et al. Target-specific de novo design of drug candidate molecules with graph-transformer-based generative adversarial networks[J]. Nature Machine Intelligence, 2025: 1-17.
来源:塔普科学