摘要:由中国抗癌协会、天津医科大学肿瘤医院联合主办,Cancer Biology & Medicine、《中国肿瘤临床》两本期刊承办的“第一届 CancerBiology & Medicine 青年学者论坛”于 2025年8月 22日在天津召开。天津医科大学肿瘤医院
由中国抗癌协会、天津医科大学肿瘤医院联合主办,Cancer Biology & Medicine、《中国肿瘤临床》两本期刊承办的“第一届 CancerBiology & Medicine 青年学者论坛”于 2025年8月 22日在天津召开。天津医科大学肿瘤医院的李祥春教授作报告了《Unlocking Cancer’s Secrets: Deep Learning from Pixels to DNA for Early Detection and Localization》。《肿瘤瞭望》现将报告主要内容整理如下。
专家简介
李祥春 教授
主要从事生物信息学、肿瘤基因组学和人工智能的研究工作,主持国家自然科学基金项目2项,并入选国家级人才青年项目。在Nature Medicine、Lancet Oncology、JAMA Oncology、Annals of Oncology和Nature Communications等国际权威期刊发表SCI论文30余篇。
人工智能(AI)发展的三大驱动力包括算法(Algorithm)、大数据(Big Data)和计算力(Computing Power)。深度学习模型是当前AI浪潮的核心驱动力,其中CNN(卷积神经网络)和Transformer都是过去十年乃至现在最重要的神经网络框架之一。CNN是计算机视觉的核心。ResNet和DenseNet是深度网络架构设计上的里程碑,ResNet解决深度网络训练中的梯度消失问题,DenseNet将特征复用推向极致。Transformer是所有大语言模型的基础架构,基于自注意力机制。
一、AI在肿瘤起源与诊断中的应用
1、甲状腺癌超声图像诊断
甲状腺超声是诊断甲状腺癌的常用方法。李祥春等人使用来自中国三家医院的超声图像集进行了一项回顾性、多队列、诊断研究,在训练集上开发并训练了深度卷积神经网络(DCNN)模型,通过分析临床超声的超声成像数据,以提高甲状腺癌的诊断准确性。研究显示AUC达0.947(内部验证集),外部验证集AUC也超过0.90。与一组熟练的放射科医生相比,DCNN模型在识别甲状腺癌患者方面表现出相似的敏感性和更好的特异性。研究结果2019年刊登于Lancet Oncology。
2、桥本甲状腺炎诊断
桥本氏甲状腺炎(HT)是一种慢性自身免疫性甲状腺疾病,是甲状腺功能减退和甲状腺肿大的主要病因。李祥春课题组、陈可欣课题组通过对17934名患者的106513张甲状腺超声图像进行深度学习训练,开发了一个用于桥本氏甲状腺炎的诊断深度学习模型,命名为HTNet。HTNet在开发中使用了迄今为止最多的样本数量,并在内部和外部测试集上进行了全面评估。结果显示,HTNet结合超声图像与血清学标志物可显著提升分类准确率。研究结果2022年发表于Nature Communications。
3、结直肠癌内镜图像诊断
基于12179名患者的464105张图像,李祥春、周德俊课题组开发了一个名为CRCNet的结直肠癌光学诊断模型,并在三个独立验证集进行系统性地验证。结果表明CRCNet在两个测试集上的召回率均超过内窥镜医师平均水平(91.3% vs 83.8%,双样本t检验p<0.001;96.5% vs 90.3%,p=0.006),在一个测试集上的精确度更高(93.7% vs 83.8%,p=0.02),而在另一个测试集的召回率及另外两个测试集的精确度指标上与医生水平相当。研究成果于2020年5月发表在Nature Communications。
4、全切片图像分类
基于Transformer的全切片图像检测模型(WIT)在TCGA数据集的32种癌症类型检测中达到82.1%的准确率(95%置信区间:80.7%–83.3%),较基线方法显著提升31.6%。研究成果2023年发表于iScience。
5、肿瘤起源鉴定
基于细胞学的深度学习方法TORCH在肿瘤起源精准定位方面表现出卓越性能。在内部和外部测试集中,TORCH的受试者工作曲线下面积值在癌症诊断0.953 ~ 0.991之间,在肿瘤起源定位0.953 ~ 0.979之间。在整个测试子集、胸腔积液子集和腹腔积液子集中,TORCH模型与资深病理学家的诊断灵敏度均高于初级病理学家。与TORCH预测一致的治疗方案带来更好临床获益。研究成果2024年在Nature Medicine发表。
6、食管鳞癌新的驱动基因与酒精摄入突变特征
该研究发现中国人食管鳞癌新的驱动基因与酒精摄入突变特征:食管鳞癌中新的驱动基因和T>C突变特征跟酒精摄入密切相关,为食管鳞癌的发生发展和防控提供了新的见解。该研究于2018年发表在Annals of Oncology。
二、AI在cfDNA液体活检中的应用
cfDNA是细胞凋亡/坏死释放的循环DNA片段,在癌症早筛、治疗监测、移植排斥监测、无创产前检测等有应用价值。传统cfDNA分析方法依赖序列比对、甲基化等特征,存在CNV、VAF假阳性、忽略有用信息等问题。报告介绍了几种新方法:
☆基于序列比对的生物信息学方法:
DELFI —— 整合片段组学特征
CancerSEEK —— 体细胞突变+血浆蛋白标志物
☆非比对统计分析方法:
MDS —— cfDNA末端模体多样性分析
NMF —— cfDNA末端模体特征谱解析
☆端到端人工智能解决方案:
李祥春团队方法:DECIDIA、EMIT、ACID和iLLMAC。
三、AI作为科研合作者
最后,报告分析了AI作为科研合作者(AI Co-Scientist)的模式,分析了其应用空间,比如AML药物重定位、肝纤维化新靶点识别和抗菌耐药基因转移机制发现。
总结与展望
Less is More:简化结构反而性能更强。More is Different:更大模型、更多数据、更强算力带来质变。数据驱动:让数据自己说话,减少人为干预。算力成本下降:指数级下降,助力AI广泛应用。号召:研究者应利用AI推动生物医学研究。报告以Richard P. Feynman名言“The truth always turns out to be simpler than you thought.”结语,强调大道至简,运用计算智能推动转化医学研究,逐步解锁癌症的奥秘。
来源:肿瘤瞭望