摘要:过去 10 年里,同时服用 2 种以上药物的人群比例从 25.4% 飙升至 41.2%,超过 40% 的 65 岁以上老人甚至需同时服用 5 种药物。
编辑丨%
过去 10 年里,同时服用 2 种以上药物的人群比例从 25.4% 飙升至 41.2%,超过 40% 的 65 岁以上老人甚至需同时服用 5 种药物。
药物的联用就像「拆弹」—— 乙酰唑胺与胰岛素联用能减轻低血糖反应,但若与糖皮质激素同服则可能引发严重的低钾血症。
据统计,同时服用 10-20 种药物时,不良反应(ADR)发生率超过 40%,而现有药物相互作用(DDI)数据库仅覆盖冰山一角,大量潜在风险信息隐藏在海量的医学文献和分子结构中。
传统预测方法如同「盲人摸象」,如何让 AI 成为精准的「药物侦探」,从多源数据中揪出隐藏的 DDI,成为相关研究者急需解决的问题。
SCAT 模型
西安交通大学与天津科技大学的研究者们开发了语义交叉注意力 Transformer 模型(Semantic Cross-Attention Transformer,SCAT)。
与现有的 DDI 预测(DDIP)方法不同,它综合运用多模态生物医学数据、BiGRU 和 Cross-Attention 来提取多模态 DDIP 的局部-全局上下文语义特征。
该研究以「SCATrans: semantic cross-attention transformer for drug–drug interaction predication through multimodal biomedical data」为题,于 2025 年 6 月 10 日刊登在《BMC Bioinformatics》。
论文链接:
该模型如同配备了「多语种翻译器」,可以同时解析三类关键线索:
1. BioBERT「文本编码器」:从医学文献中提取药物关系,比如阿司匹林可降低心肌梗死风险中的相互作用信号;
2. Doc2Vec 「背景调查员」:分析药物说明书等长文本,补充如布洛芬的抗炎机制等背景知识;
3. Graph2Vec 「分子显微镜」:拆解药物分子图,比如通过 SMILES 序列识别潜在反应位点。
这些信息经 BiGRU 整合后,由 Cross-Attention 动态加权。分子结构的反应活性可能比文本描述更关键,而临床案例又比单一分子特征更具说服力。
图 1:SCAT 的架构。
BioBERT 是一个预训练模型,其原型来自于 BERT(能结合双向表示的信息),并且在许多生物医学文本挖掘任务上明显优于 BERT 和最先进的模型。由于对架构的修改最小,它被广泛应用于生物医学文本挖掘。
源代码:https://github.com/dmis-lab/biobert
它可以为预处理的生物医学语料库的句子生成对应的词向量嵌入,并连接为句子向量,再交由 Word2Vec 和 Doc2Vec 将文本数据转换为矢量表示(后者可用于测量完整文档之间的关系)。
图 2:Doc2Vec 的药物描述文档的嵌入过程。
Cross-Attention 在 Transformer 架构中被广泛使用,用于组合两个不同的 embedding 序列来捕获它们之间的依赖关系。
在 SCAT 中,Cross-Attention 根据 DDIP 任务动态关注多模态数据的不同部分。它可以处理药物对特征序列之间的语义关系,使用 MHSA 获得多集注意力结果。
对比验证
基于 SCAT 的 DDIP 方法经过验证,并与五种最先进的 DDIP 方法进行了比较:MFD-GDrug、DrugDAGT、DDI-GCN、DDI-MuG、DGNN-DDI。
所有模型均在 DDIExtraction - 2013 数据集(包含 175 篇 MedLine 摘要和 730 篇 DrugBank 文献)中进行了严格测试。结果显示,SCAT 模型展现出了惊人的能力。
图 3:每种 DDI 类型的命中率。
SCAT 在所有药物-药物相互作用类型中普遍优于 DrugDAGT,相较于这些模型,提升幅度最低在 0.71%,最高在 12.10%。
消融实验中,仅在嵌入层中使用生物医学词(BW)嵌入实现了 70.14% 的较高 Acc,虽然多嵌入特征融合可以提高 DDIP 性能的同时也会导致特征冗余和噪声信息,并增加训练时间。
小结
为了提高 DDIP 性能,研究团队构建了一个名为 SCAT 的语义跨注意力变换器模型,用于生物医学多模态 DDIP。该模型通过双向 GRU 和跨注意力机制,可以全面提取局部-全局上下文特征及其相互作用。
在 DDIExtraction2013 数据集上的实验结果表明,SCAT 优于最先进的 DDIP 方法。
由于复杂的生物医学语料库和样本不平衡,未来的工作中,团队将尝试使用各种多模态数据和新的嵌入方法来提高 SCAT 的 DDIP 性能和可解释性。
来源:科学奇楼馆