摘要:老规矩,开篇还是要问个小问题:在座的各位有谁的工作或者生活日常,已经离不开人工智能(AI)的助力了呢?拿AI玩梗找乐的不算哈。像奇点糕虽然一直倾向于自己动手解决问题,但在小语种翻译或者查阅地道的英文表述时,第一反应现在也是让AI帮忙啦。
*仅供医学专业人士阅读参考
老规矩,开篇还是要问个小问题:在座的各位有谁的工作或者生活日常,已经离不开人工智能(AI)的助力了呢?拿AI玩梗找乐的不算哈。像奇点糕虽然一直倾向于自己动手解决问题,但在小语种翻译或者查阅地道的英文表述时,第一反应现在也是让AI帮忙啦。
但相比这些“小打小闹”,AI对临床实践的变革才是大家希望看到的。比如今天,德国研究者们在Nature Medicine期刊发表的一项大规模、前瞻性真实世界研究就显示:影像科医生在AI支持下阅片,可使接受乳腺癌筛查的50-69岁女性乳腺癌检出率显著提高17.6%,且并未对召回率(recall rate)产生负面影响,意味着AI能成为乳腺癌筛查的可靠助力[1]。
论文首页截图
其实在ChatGPT们火起来之前,“AI阅片”助力癌症筛查的概念就已经颇受青睐了,毕竟AI的工作效率杠杠的,如果能做到既高速又精准,就非常适合工作量往往巨大的筛查场景,特别是用于筛查乳腺癌之类的常见癌症。所以近年来,AI参与乳腺癌筛查的研究也是层出不穷,但大多数还是回顾性研究,且样本量一般都不算大。
而这次来自德国的真实世界研究,可以说就大气得多了:研究者们在德国国家性乳腺癌筛查项目的12个站点安装了AI辅助阅片软件,邀请119名影像科医生参与研究,而纳入研究的筛查对象,即50-69岁女性共有46万余人,每位接受筛查女性的乳腺X光检查结果,均由两名医生分别独立阅片,其中26万女性被分入AI辅助阅片组,剩余则为对照组。
研究使用的辅助阅片软件Vara MG主要有两种特征,其一是AI模型判断“高度不可疑”的检查所见,会被归类为正常迹象,必要时由医生进行复核;其二则是“安全网”设置,即AI模型会判断和选取“高度可疑”的影像特征,如果影像科医生在阅片时将这类迹象判读为正常,“安全网”就会被激活并发出信息提醒,让医生对可疑迹象所在的部位再度进行判读[2]。
右图中白框区域即为“安全网”激活表现
说完这些,就直接来看看AI在实战中的表现好啦:AI辅助阅片组和对照组的乳腺癌检出率分别为6.7例/每1000人和5.7例/每1000人,意味着AI辅助使检出率相对提高了17.6%,且具有统计学显著性(95% CI: +5.7%, +30.8%),两组的阳性预测值(PPV)分别为17.9%和14.9%,召回率则分别为37.3和38.4/每1000人,AI辅助组也小占上风。
而AI辅助阅片软件中的“安全网”,共在3959例(1.5%)筛查中被触发,其中1077次结论被影像科医生认可,也直接使204例乳腺癌被检出;反过来说,8000余例被AI认定高度不可疑,但被医生团队再度评估的“正常”影像特征,则仅有20例是乳腺癌。
AI辅助阅片的各项关键数据
就看这一组数据来说,AI辅助阅片确实起到了不小的加持作用,且对不同年龄/乳腺密度/筛查轮次的女性,AI辅助阅片都表现良好。另外,AI辅助也能在一定程度上加快影像科医生的阅片效率,例如对AI标记为正常的检查结果,医生的中位阅读时间仅有16秒(标记不确定结果时为30秒,触发安全网时则为99秒)。
其实按奇点糕的看法,都不用说什么安全网和加速阅片,17.6%的检出率提升就足以让AI在未来临床筛查中占据一席之地啦,至于怎么让AI真正融入工作流程,这就是各位临床一线读者们要操心,可能也是必然要操心的问题,加油吧就参考文献:
[1]Eisemann N, Bunk S, Mukama T, et al. Nationwide real-world implementation of AI for cancer detection in population-based mammography screening[J]. Nature Medicine, 2025.
[2]Leibig C, Brehmer M, Bunk S, et al. Combining the strengths of radiologists and AI for breast cancer screening: a retrospective analysis[J]. The Lancet Digital Health, 2022, 4(7): e507-e519.
来源:奇点肿瘤探秘