NC | 有效探索药物-靶点相互作用、辅助理解药物作用机制的新方法

B站影视 港台电影 2025-04-03 20:27 1

摘要:今天给大家讲一篇2025年2月在nature communications上发表的一篇关于深度学习方法应用于化合物靶标相互作用预测的文章。在药物发现领域,准确预测药物-靶点相互作用(DTIs)至关重要,但受限于标记数据不足、冷启动问题以及对药物作用机制(MoA

今天给大家讲一篇2025年2月在nature communications上发表的一篇关于深度学习方法应用于化合物靶标相互作用预测的文章。在药物发现领域,准确预测药物-靶点相互作用(DTIs)至关重要,但受限于标记数据不足、冷启动问题以及对药物作用机制(MoA)理解的不充分等挑战。针对这些局限性,本研究提出了DTIAM这一统一框架,通过自监督预训练从无标签数据中学习药物和靶点的表征,以提升预测准确性。实验显示,DTIAM在所有预测任务中(尤其在冷启动场景下)均优于现有方法,并展现出强大的泛化能力。这一方法的提出为预测新的DTIs提供了实用工具,它不仅能够有效区分药物的作用机制,无论是激活还是抑制,从而加速筛选出具有前景的药物候选物,而且对于推动未来药物设计领域的进步具有深远的意义。

药物-靶点相互作用(DTIs)的准确预测对于药物发现和开发至关重要,它有助于理解药物的作用机制,并减少开发过程中的成本和时间。当前的计算方法主要分为二分类预测(是否存在相互作用)和回归预测(预测结合亲和力)。评估DTIs通常涉及多种计算方法,这些方法可以分为四大类:基于结构的方法、基于配体的方法、基于网络的方法和基于机器学习的方法。基于结构的方法依赖于配体和靶点的三维结构信息,通过分子对接和自由能计算等手段模拟相互作用,尽管这些方法在理论上能够提供精确预测,但受限于靶蛋白结构信息的可获得性,且计算资源需求高。基于配体的方法则侧重于药物的理化性质,如定量结构活性关系(QSAR),将候选配体与特定靶点的已知配体进行相似性比较以预测潜在的相互作用,但这种方法可能无法充分捕捉靶点结构的复杂性。基于网络的方法则是通过整合多种数据资源(如基因组学、蛋白质组学和药理学)构建可靠的网络,并利用网络中的拓扑和结构信息进行潜在关联预测。机器学习方法则是运用已知配体和靶点输入数据的潜在特征来预测它们的相互作用。因此,利用计算方法来解析药物的作用机制可以为药物开发和精准医疗提供更为全面的见解。

化合物预训练模块通过自监督学习的方法来从大量未标记的化合物数据中有效提取上下文信息和分子子结构之间的隐含特征。同样,蛋白预训练模块也通过自监督学习方法从大量蛋白序列数据中学习蛋白的表示和接触信息。药物-靶点预测模块则结合化合物和蛋白的表示来捕捉它们复杂的相互作用,以实现准确可靠的预测。

图1 DTIAM模型架构

3.1 DTI预测性能评估

为了评估DTIAM在DTI预测任务中的有效性,实验设置了三种不同的场景,分别为热启动药物冷启动靶点冷启动场景。药物冷启动表示模型在已知靶点但未知药物的情况下进行预测,热启动对应于模型预测已知的药物和靶点,靶点冷启动表示模型在已知药物但未知靶点的情况下进行预测。实验结果表明在Yamanishi08数据集上,DTIAM在三种设置下都显示出了较高的预测性能,这表明DTIAM在处理未知药物或靶点的情况时具有优势。此外,DTIAM模型性能的优越性能可能由于其在预训练阶段能够从大量未标注数据中捕捉到药物和靶点的潜在特征,而且在靶点冷启动设置下的预测性能普遍优于药物冷启动的设置下的预测性能,这可能与数据集中靶点数量多于药物有关(图2)。

图2 DTIAM在DTI预测方面的性能

3.2 作用机制预测性能评估

为了理解药物在体内是通过哪些靶点发挥作用,以及它们是如何相互作用的,作者展开了MoA预测的实验任务,即预测给定的药物-靶点对是否表现出激活或抑制效果。其中数据集源自于治疗靶点数据库,并通过5折交叉验证在三种不同的实验设置下比较了DTIAM模型与AI-DTI48模型在MoA预测任务上的表现。实验结果显示,在所有三个设置中,DTIAM在激活和抑制数据集上的表现均优于AI-DTI48。在抑制数据集上,特别是在靶点冷启动场景中,DTIAM的性能显著优于AI-DTI48。这一结果表明了基于靶点的预训练模型能够从大量氨基酸序列中学习到结构信息,从而在靶点冷启动情况下提升预测性能

图3 作用机制预测性能评估

3.3 消融实验分析

为了验证提出的预训练方法的有效性,作者在DTI、DTA和MoA三个预测任务上,与不同规模的标记数据的基准方法进行了比较,分别将六个不同任务数据集中的20%、40%、60%和80%的样本用于训练,并使用剩余的样本在热启动的设置下进行验证。如图4所示,随着训练样本数量的增加,所有方法的预测性能都有不同程度的提升。DTIAM在所有不同数据划分下都取得了最佳性能,并且显著优于其他基准方法。可以发现,DTIAM仅使用20%的样本进行训练,其预测性能可超越使用60%甚至80%样本训练的其他方法。因此,该预训练策略能够从大量未标记数据中提取有效的特征,从而提高下游预测任务的准确性

图4 不同规模的数据训练对模型性能的影响

准确预测药物-靶点相互作用对于药物发现和开发具有重要意义。然而,现有方法大多集中在药物靶点相互作用预测的二分类或药物-靶点亲和力的回归预测,而忽略了药物的作用机制(MoA)信息。因此,为了解决上述局限性,本研究开发了一个名为DTIAM的统一框架,该框架结合了药物和靶点的预训练模型以及自动化机器学习(AutoML)技术,用于预测DTI、DTA和MoA,利用自监督学习从大量未标记数据中提取子结构及上下文的特征信息,在多种预测任务中均取得了优越的性能,显著优于现有的机器学习方法。 未来将考虑整合蛋白质动力学及蛋白质突变信息,以提高模型的鲁棒性、可解释性和对关键突变位点的敏感性,使其成为药物设计中较为精确和有效的工具,有助于加速新药的发现和开发过程。

参考文献

[1] Lu Z, Song G, Zhu H, et al. DTIAM: a unified framework for predicting drug-target interactions, binding affinities and drug mechanisms[J]. Nature Communications, 2025, 16(1): 2548.

来源:洛书大健康

相关推荐