摘要:癌症治疗的一个主要挑战是患者间的药物反应差异。患者来源的类器官虽能较好地保留遗传和组织学特征及药物敏感性,可用于预测临床结果。但类器官培养和测试耗时耗钱,限制了临床应用。
癌症治疗的一个主要挑战是患者间的药物反应差异。患者来源的类器官虽能较好地保留遗传和组织学特征及药物敏感性,可用于预测临床结果。但类器官培养和测试耗时耗钱,限制了临床应用。
因此,南昌大学赵冰、程敏章团队开发了一种基于Transformer架构和迁移习的临床药物反应预测模型-PharmaFormer。
结果表明,PharmaFormer整合了泛癌细胞系和特定类型肿瘤的类器官,可以显著提高对临床药物反应的准确预测。研究强调,先进的AI与类器官模型相结合将推动精准医疗和药物开发。
文章介绍
题目:PharmaFormer通过患者来源的类器官指导的迁移学习预测临床药物反应
期刊:NPJ Precision Oncology
影响因子:8.0
发表日期:2025年8月
#1
研究背景
Background
癌症患者的药物反应变异性仍然是临床肿瘤学中的关键挑战。尽管肿瘤生物标志物发现和精准医学取得了最新进展,但化疗和靶向治疗的总体反应率仍然不理想。
传统的治疗策略依赖于临床直觉和有限的生物标志物,而人工智能(AI)在从全面的基因组数据中系统地预测药物反应方面显示出潜力。个性化治疗已显示出显著改善癌症治疗结果的潜力。
大规模肿瘤细胞系筛选项目,例如癌症药物敏感性基因组学(GDSC)和癌症治疗反应门户(CTRP)产生了大量药物反应数据,促进了各种药物反应预测算法的发展。然而,传统的二维细胞系往往无法概括肿瘤微环境的复杂性,限制了其预测能力。
患者来源的肿瘤类器官保留了基因组突变、基因表达谱和肿瘤组织的三维形态,成为反映对癌症治疗的临床反应的有前途的模型。类器官在多种癌症治疗决策中显示出潜力,但其临床应用受限于高成本、低成功率以及长测试周期。
此外,类器官的药物基因组学数据有限,难以满足深度学习模型的需求。将二维细胞系数据与类器官的优势相结合,可以建立准确且可扩展的预测模型。
最近,基于Transformer架构的基础模型,通过迁移学习在有限数据集上表现出色。迁移学习还可整合RNA-seq和单细胞测序数据,用于药物反应预测。通过微调在广泛细胞系数据集上预训练的模型,可以利用有限的类器官数据进行药物反应预测。
#2
研究方法
Methods
首先开发了一种临床药物反应预测模型PharmaFormer。然后将其算法与经典机器学习的算法进行比较,并对每种药物的平均Person相关系数进行五倍验证,建立了ParmaFormer预训练模型的基准性能。
接着,使用患者来源的类器官的数据对预训练模型进行微调,评估了PharmaFormer在临床中预测药物反应的能力,并比较了四种训练策略验证了迁移学习能够提高临床药物反应预测的准确性。
最后,在另一个预训练模型中确定微调模型的增强可归因于类器官模型,并全面地对PharmaFormer的临床预测性能进行基准测试。
#3
关键研究结果
Results
1. PharmaFormer概述
为了从患者肿瘤组织的批量RNA-seq数据中预测临床药物反应,开发了PharmaFormer。实施了一种迁移学习策略,整合了泛癌细胞系数据和肿瘤特异性类器官数据。
PharmaFormer分三个关键阶段:
第一阶段:从GDSC获得900多种细胞系的基因表达谱和100多种药物的剂量反应曲线下面积(AUC),将其输入系统开发了一个预训练模型;
第二阶段:使用肿瘤特异性类器官药物反应数据的小型数据集对这个预训练模型进行微调,并充分优化模型参数,生成最终的类器官微调模型;
第三阶段:应用类器官微调模型来预测特定肿瘤类型的临床药物反应。PharmaFormer使用不同的特征提取器分别处理细胞基因表达谱和药物分子结构;经过特征串联和重塑后,数据流入由三层组成的Transformer编码器;编码器随后输出药物反应预测(图1)。
图1 PharmaFormer模型示意图。
2. PharmaFormer预训练模型的性能基准测试
为了建立PharmaFormer预训练模型在初始训练阶段的基准性能,比较了Pharmaformer的算法与经典机器学习算法,包括支持向量机(SVR)、多层感知器(MLP)、随机森林(RF)、k最近邻(KNN)和岭回归(Ridge)。
还应用五重交叉验证进行了稳健的性能评估,分别计算了所有细胞系中每种药物的预测反应和实际反应之间的Pearson和Spearman相关系数。与SVR、MLP、RF、Ridge和KNN相比,PharmaFormer预训练模型以最高的Pearson相关系数表现出色。这些结果强调了Pharmaformer卓越的预测准确性。
随后,应用了分层交叉验证方法,评估了各种组织类型和TCGA肿瘤亚组的模型性能。为了进一步剖析该模型的性能,分别评估了其对FDA批准的60种药物中每一种的预测准确性。
此外,在将靶向治疗与传统化疗进行比较时,或将FDA批准和非FDA批准的药物进行比较时,预测性能没有显著差异,这凸显了该模型在不同药物类别中的一致准确性。
与其他策略相比,PharmaFormer的表现始终优于其他模型,并在大多数组织、肿瘤类型和药物中表现出增强的稳定性,在Spearman相关性中观察到类似的结果。
这种一致性强调了PharmaFormer相对于经典模型的鲁棒性和适应性(图2)。
图2 PharmaFormer预训练模型与经典机器学习模型在细胞系数据集上的比较分析。
3. PharmaFormer能够准确评估临床药物反应
为了进一步评估PharmaFormer在真实临床环境中预测药物反应的能力,研究人员使用29个结肠癌类器官的数据对预训练模型进行微调,并应用其预测TCGA结肠癌患者的药物反应。
重点关注了5-氟尿嘧啶和奥沙利铂,将患者分为药物敏感组和耐药组。类器官微调模型的预测性能优于预训练模型,两种药物的风险比均增加。在膀胱癌患者中,吉西他滨和顺铂的预测准确性和风险比也增加。
研究比较了四种训练策略,发现类器官微调方法在所有测试的药物中表现出最佳的预测性能。此外,还在四个独立的结直肠癌队列上验证了模型的普遍性,发现类器官的微调模型始终表现出更强的区分反应和无反应患者的能力。
这有力地支持了使用患者来源的类器官数据微调可以增强模型识别将从特定药物治疗中受益患者的主张(图3)。
图3 PharmaFormer模型预测结肠癌队列和膀胱癌队列药物反应的评估。
4. 使用类器官数据进行迁移学习可提高预测准确性
但仍然不确定微调模型的增强是否仅归因于类器官。因此,研究人员启动了另一个预训练模型。结果表明,用结肠癌细胞系微调的模型对5-氟尿嘧啶的临床药物反应的预测性较差。
相比之下,使用结肠癌类器官微调的模型实现了最佳的预测准确性。在膀胱癌中也出现了类似的趋势,其中用膀胱癌类器官微调的模型优于用细胞系微调的模型(图4)。
图4 使用类器官数据进行迁移学习可提高预测准确性
5. PharmaFormer与规范机器学习方法的性能评估
为了全面对Pharmaformer的临床预测性能进行基准测试,将其与多种方法进行比较。其中一些比较模型,例如SVR和深度神经网络,在特定病例表现出有限的预测能力,并且总体表现不佳。而PharmaFormer在预测一系列肿瘤类型和药物类别的临床药物反应方面始终表现出优越性。
基于Transformer的架构专门设计用于利用迁移学习策略,使预测准确性明显高于任何其他模型。此外,PharmaFormer生成的风险分层系数明显高于所有其他模型。
这强调了其在预测一线化疗和不同肿瘤来源的多靶点药物的临床结果方面的强大能力(图5)。
图5 PharmaFormer与规范机器学习方法的性能评估。
结论、
总之,PharmaFormer通过迁移学习有效整合不同类型的临床前模型,为临床药物反应预测引入了一种新的范式。
这项研究强调了先进类器官模型和前沿人工智能模型之间的潜在协同作用,以加速精准医疗和药物开发。
参考文献
Zhou Y, Dai Q, Xu Y, Wu S, Cheng M, Zhao B. PharmaFormer predicts clinical drug responses through transfer learning guided by patient derived organoid. NPJ Precis Oncol. 2025 Aug 13;9(1):282. doi: 10.1038/s41698-025-01082-6.
来源:培养盒守护者