摘要:近年来,许多机器学习模型正在加速药物的研发过程。然而,现有方法主要局限于单一任务(预测药物-靶标相互作用(DTI)、药物分子生成),无法同时进行多项任务。
编辑 | 萝卜皮
在药物研发中,识别能够与靶蛋白相互作用的新型药物是一项高难度、高耗时、高成本的任务。
近年来,许多机器学习模型正在加速药物的研发过程。然而,现有方法主要局限于单一任务(预测药物-靶标相互作用(DTI)、药物分子生成),无法同时进行多项任务。
在最新的研究中,中南大学、赫尔辛基大学(University of Helsinki)的研究人员开发了一个新的多任务学习框架 DeepDTAGen,该框架可以预测药物-靶标结合亲和力,并同时生成新的靶标感知药物变体,并利用这两项任务的共同特征生成新型药物。
该研究以「DeepDTAGen: a multitask deep learning framework for drug-target affinity prediction and target-aware drugs generation」为题,于 2025 年 5 月 30 日发布在《Nature Communications》。
药物研发的核心是通过发现、修饰和设计能与靶蛋白相互作用的新药,但传统实验方法成本高、耗时长。
为此,计算数据驱动模型被广泛应用,分为预测模型(如预测药物-靶点相互作用 DTI)和生成模型(如生成新药)。
DTI 不仅能指导新药研发,还在药物重定位(即老药新用)中发挥重要作用;而药物-靶点结合亲和力(DTA)预测近年更受关注,其通过回归模型(如KronRLS、SimBoost)或深度学习模型(如DeepDTA、GraphDTA)量化相互作用强度,但现有模型在特征提取(如分子结构信息)和任务整合(如CoVAE)方面有局限性。
生成模型(如对抗生成网络和变分自编码器)能创造大量新药组合,但无法有效结合药物与靶点的结合动力学信息,导致生成结果可能缺乏实际有效性。
为此,中南大学的研究人员提出了一个多任务学习 (MTL) 框架 DeepDTAGen,它通过使用两个函数的共同特征(如配体-受体相互作用的知识)空间同时执行这两个任务(预测 DTA 和生成新药物)。
图示:模型架构。(来源:论文)
最小化 DTA 预测任务中的损失可确保在潜在空间中学习 DTI 特定特征,但是在药物生成任务中利用这些特征可确保生成目标感知药物,从而显著提高其临床成功的可能性。
另外,MTL 模型通常容易遇到诸如梯度冲突之类的优化难题。为了在 DeepDTAGen 中解决这些问题,研究人员开发了 Fetter Gradients(FetterGard)算法来缓解梯度冲突。
与现有方法不同,DeepDTAGen 主要具有以下基本创新之处:
(i)所提出的模型使用共享特征空间并在统一模型中执行这些任务。
(ii)FetterGrad 算法在从共享特征空间学习的同时保持两个任务的梯度保持一致。它通过最小化任务梯度之间的欧几里得距离(ED)来缓解梯度冲突和偏差学习。
(iii)DeepDTAGen 提供两个目标函数:它预测药物-靶标亲和力值,同时根据输入相互作用生成靶标感知药物。
经过全面的实验结果表明,DeepDTAGen 不仅可以准确预测药物与靶标之间的结合亲和力,还可以成功生成靶标感知药物。
性能评估
图示:在 KIBA、Davis 和 BindingDB 测试集上,预测亲和力值与实际亲和力值的散点可视化。(来源:论文)
具体来说,研究人员通过 (i) 药物选择性、(ii) 定量构效关系分析和 (iii) 冷启动测试评估了 DeepDTAGen 在 DTA 预测中的稳健性。
药物选择性分析表明,DeepDTAGen 的亲和力预测与药物和靶标之间的生物学相关行为相一致,其中根据亲和力概况从每个数据集中选择两种药物:一种药物与不同靶标的亲和力变化很大,另一种药物与其靶标的亲和力水平一致。该模型成功预测了两种药物的准确亲和力,表明它具有学习 DTI 生物学模式的能力。
同样,在另一项测试中,研究人员进行了四次随机化实验,破坏了药物与靶点之间的关联,从而验证 DeepDTAGen 学习它们之间真实关系的能力。通过比较标准数据集和置换数据集的结果,表明 DeepDTAGen 成功地学习了药物与靶点之间的真实关系。
对于生成任务,研究人员对生成的药物进行了 (i) 化学成药性分析、(ii) 靶点感知和 (iii) 多药理学分析。结果证明,DeepDTAGen 能够成功生成靶标感知药物。
图示:所生成药物的多药理学用药性。(来源:论文)
为了评估 DTA 任务是否能够有效地引导网络生成这些靶标感知药物,研究人员进行了一项实验,分别在有和无 DTA 任务的情况下对模型进行了训练。结果表明,使用 DTA 任务生成的药物与其种子靶标的亲和力比未使用 DTA 任务生成的药物更强。
结语
「我们相信,DeepDTAGen 通过预测药物靶点亲和力和新型靶向药物生成,为药物发现过程提供了一种灵活的策略。」研究人员在论文里表示。
虽然 DeepDTAGen 在两个任务上都表现良好,但它仍然存在缺乏 QED、LogP 和 SAS 等化学性质作为条件支持的局限性。其次,该模型忽略了输入分子的立体化学动力学,而立体化学在药物开发和发现中起着重要作用。
因此,考虑这些特性,并结合适当的引导机制和嵌入立体化学信息,将是一个有价值的扩展。此外,该模型还可以通过在训练期间合并非相互作用的数据进行扩展,从而可以增强具有更高选择性的药物生成。
论文链接:
来源:橘子爱科学