AI诊断的黑色幽默:对不起,算法比主任医师多看了十万张片子

B站影视 2025-01-26 07:11 2

摘要:在医疗技术飞速发展的今天,人工智能(AI)的身影越来越频繁地出现在我们的视野中。你能想象吗?一场特殊的 “竞赛” 正在医疗领域悄然上演,参赛的双方,一方是经验丰富、知识渊博的主任医师,另一方则是看似冰冷、没有情感的 AI 算法。

在医疗技术飞速发展的今天,人工智能(AI)的身影越来越频繁地出现在我们的视野中。你能想象吗?一场特殊的 “竞赛” 正在医疗领域悄然上演,参赛的双方,一方是经验丰富、知识渊博的主任医师,另一方则是看似冰冷、没有情感的 AI 算法。

故事发生在南方医院的消化内镜中心,这里进行了一场别开生面的人机对比测试赛。一份包含 5 万余张的胶囊内镜图片,成为了这场竞赛的 “考题”。以往,面对这样庞大数量的图片,即使是有着 5 年以上经验的资深胶囊内镜医生,也需要分秒必争地审阅筛查,最少也要花费 1 - 2 小时才能完成。而且这个过程枯燥乏味,医生很容易产生疲劳感,这无疑增加了误诊、漏诊的风险。

然而,令人惊叹的是,AI 算法在这场竞赛中展现出了惊人的实力。仅仅 15 分钟,它就出具了一份胶囊内镜初步报告。不仅如此,在胃内结构识别准确率和病灶检出率方面,AI 算法都优于那位经验丰富的医生。这一结果,无疑像一颗重磅炸弹,在医疗领域掀起了巨大的波澜。

南方医院的这场人机测试赛,只是 AI 在医疗影像诊断领域展现强大实力的一个缩影。随着科技的飞速发展,AI 诊断正以一种前所未有的态势崛起,其核心就在于对海量数据的学习和分析。

AI 诊断技术的发展,离不开海量医学影像数据的支持。这些数据就像是 AI 的 “学习资料”,通过对它们的学习,AI 能够不断提升自己的诊断能力。香港大学工程学院的研究团队就开发出了一种新人工智能演算方法,这种方法可以从数十万份 X 射线影像报告中自动获取监督信号,以此来训练预测模型 。

研究团队利用公开数据库中 37 万份 X 射线影像和文本报告作为训练模型的基础,这些数据涵盖了 14 种胸肺相关疾病,包括肺不张、心脏肥大、胸腔积液、肺炎和气胸等医疗诊断数据。基于这些数据训练模型,团队仅使用 100 张 X 射线影像便建立一个初步令人满意的 X 射线影像识别模型,其预测准确度达 83%。当使用的影像增加到 1000 张,模型的预测准确度达 88.2%,超越用放射科医生标注 10000 张 X 射线影像进行训练的模型。而当训练影像增加到 10000 张,模型准确度达到 90.1%。预测模型准确度达 85% 以上已可作实际临床诊断应用。

与传统的依赖人手标注数据训练模型的方式相比,这种新算法能自动从文本报告中的每个词获取监督信号,用以训练人工智能神经网络精确解读 X 射线影像,大幅减省人力成本达 90%。这充分展示了 AI 在处理海量数据时的高效性和强大能力,它能够从这些看似繁杂的数据中,快速准确地提取关键信息,从而提升诊断的准确性。

除了在数据处理上的优势,AI 在实际诊断表现上也开始超越人类医生。哈佛大学、斯坦福大学、微软等顶尖学府和机构的多名医学、AI 专家联合开展的一项研究,对 OpenAI 旗下 o1 - preview 模型在医学推理任务的表现进行了综合评估。结果显示,o1 - preview 模型在多项任务中表现出卓越的能力,在鉴别诊断生成(判断 “这是什么病”)、诊断临床推理(判断 “这最可能是什么病”)和管理推理(判断 “应该如何治疗”)方面,甚至达到了超人类水平。

在评估 o1 - preview 鉴别诊断生成的能力时,研究人员使用了发表在国际顶级医学期刊《新英格兰医学杂志》上的临床病理会议病例。结果表明,o1 - preview 在鉴别诊断中的准确率高达 78.3%,在 88.6% 的病例中得出了准确或非常接近准确的诊断结果,而 GPT - 4 只有 72.9%。在 87.5% 的病例中,o1 - preview 选择了恰当的检查项目;另在 11% 的病例中,两位医生均认为该模型所选检查方案是有效的;而在仅有的 1.5% 的病例中,其检查方案被两位医生认为是无效的。

为了进一步评估 o1 - preview 的临床推理能力,研究人员使用了 NEJM Healer(一款在线工具,学习者可以通过与虚拟患者的互动来提升他们的临床推理和诊断技能)中的 20 个临床病例。结果表明,o1 - preview 的表现明显优于 GPT - 4、主治医师和住院医师,在 80 例病例中,有 78 例获得了完美的 R - IDEA 评分(R - IDEA 评分是一个 10 分制量表,用于评估临床推理能力)。

不仅如此,斯坦福大学等机构进行的临床试验显示,单独使用 ChatGPT 的准确率高达 90%,远超人类医生 74% 的平均准确率。在这场特殊的 “竞赛” 中,AI 凭借着对海量数据的学习和强大的算法,在诊断表现上似乎已经超越了人类医生,成为了医疗领域的 “超级阅片者”。

在漫长的医学发展历程中,医生们形成了一套独特的诊断思维方式。他们凭借多年的学习和实践经验,通过望、闻、问、切等传统方法,对患者的病情进行综合判断。当面对一位前来就诊的患者时,医生会首先观察患者的面色、神态、体态等外部表现,从中获取初步的信息。接着,通过询问患者的病史、症状、生活习惯等,进一步了解病情。在这个过程中,医生的直觉和经验起着至关重要的作用。

这种传统的诊断方式,虽然在很多情况下能够准确地判断病情,但也存在着一定的局限性。医学领域的知识和经验是一个不断积累的过程,一个医生的成长需要经历多年的学习和实践。即使是经验丰富的主任医师,其接触到的病例也是有限的。面对一些罕见病或者复杂病例时,医生可能会因为缺乏相关的经验而出现误诊、漏诊的情况。而且,医生在诊断过程中,难免会受到主观因素的影响,如个人的认知水平、情绪状态等,这也可能导致诊断结果的偏差。

尽管 AI 诊断技术在医疗领域展现出了巨大的潜力,但在实际应用中,医生与 AI 的合作却面临着诸多困境。一方面,医生对 AI 技术的信任度较低。医疗行业关乎患者的生命健康,医生们在做出诊断和治疗决策时,往往会非常谨慎。AI 技术虽然能够处理大量的数据,但它缺乏人类医生所具备的临床经验和直觉,这使得医生们对 AI 诊断结果的可靠性存在疑虑。一项针对医务人员的调查显示,大约 52% 的医生对 AI 系统的准确性没有足够的信任。

另一方面,医生在使用 AI 工具时,也存在着一些操作上的问题。由于 AI 技术的专业性较强,医生们需要花费一定的时间和精力去学习如何使用这些工具。在实际操作中,一些医生可能会因为对 AI 工具的不熟悉,而出现操作不当的情况,从而影响诊断结果。此前有一款号称能帮助医生提高诊断效率的 AI 工具,在实际使用中却显露出了一系列问题,它对不同疾病的识别能力不足,尤其在复杂病例中,常常出现误判。当医生依赖于工具给出的建议而忽视自身经验时,便成了医疗事故的隐患 。这一事件也反映出,医生在使用 AI 工具时,需要更加谨慎,不能盲目依赖。

在这个看似充满希望的 AI 诊断时代,背后却隐藏着一丝黑色幽默。当 AI 凭借着海量的数据和强大的算法,在诊断准确率上超越人类医生时,我们不禁要问:医疗,这个充满人文关怀的领域,难道真的要被冰冷的机器所取代?

一个 4 岁的美国小男孩的经历,让我们深刻地感受到了这种黑色幽默。小男孩在运动后身体剧痛,还出现了磨牙和不长个等症状。他的父母带着他看了 17 名医生,其中不乏儿科、骨科领域的业内专家,然而,所有的医生都未能准确诊断出他的病因。直到他的母亲求助于 ChatGPT,这个被 17 位医生都误诊的 “怪病”,才最终被确诊为脊髓栓系综合征。神经外科医生根据 ChatGPT 的诊断结果,一眼就指出了栓系的具体位置,小男孩也因此接受了手术治疗,目前正在康复过程中 。

这一事件无疑像一记重锤,狠狠地砸在了人类医生的 “自尊” 上。17 位经验丰富的医生,在面对这个复杂病例时,竟然输给了一个没有情感、没有温度的 AI。这其中的荒诞感,让人不禁苦笑。医疗,本应是人与人之间温暖的交流,医生通过与患者的沟通,了解他们的痛苦,给予他们关怀和安慰。然而,在这个案例中,冰冷的机器却成为了最后的 “救星”,这无疑是对传统医疗模式的一种讽刺。

AI 诊断的崛起,让我们对医疗行业的未来充满了担忧和迷茫。AI 在诊断效率和准确率上的优势,是否意味着医生这个职业将逐渐被淘汰?未来的医疗行业,是否会变成一个由机器主导的 “冰冷世界”?

虽然目前 AI 在医疗领域的应用还存在诸多问题,如数据隐私保护、伦理道德等,但不可否认的是,AI 技术正在以惊人的速度发展。也许在不久的将来,AI 真的能够完全取代医生的工作。到那时,患者走进医院,面对的不再是和蔼可亲的医生,而是一台台冰冷的机器。医生,这个曾经被人们视为救死扶伤的神圣职业,是否会成为历史的尘埃?

在这场医疗未来的 “迷茫棋局” 中,我们需要重新审视医生的角色和价值。医生不仅仅是疾病的诊断者和治疗者,更是患者心灵的抚慰者。他们的经验、直觉和人文关怀,是 AI 永远无法替代的。也许,未来的医疗模式将是 AI 与医生的深度合作,AI 负责处理海量的数据和复杂的计算,医生则专注于与患者的沟通和情感交流,为患者提供更加全面、个性化的医疗服务 。

在这场 AI 诊断与医生诊断的 “较量” 中,我们看到了 AI 的强大,也看到了医生的坚守。AI 诊断凭借其对海量数据的处理能力和高效的算法,在诊断效率和准确率上取得了显著的成绩;而医生则依靠丰富的临床经验、敏锐的直觉和温暖的人文关怀,为患者提供着全方位的医疗服务。

AI 与医生,并非是相互替代的关系,而是应该相互补充、相互协作。AI 可以成为医生的得力助手,帮助医生处理大量的数据,提高诊断效率,减少误诊、漏诊的风险;而医生则可以在 AI 的辅助下,更加专注于与患者的沟通和交流,为患者提供更加个性化、人性化的医疗服务。

未来的医疗模式,或许将是 AI 与医生深度融合的时代。在这个时代里,我们期待看到 AI 技术的不断进步,为医疗领域带来更多的惊喜;同时,我们也希望医生的价值能够得到充分的尊重和体现,他们的经验和智慧,将继续在医疗舞台上发光发热。让我们共同期待,一个更加高效、精准、温暖的医疗未来。

来源:万物一马也

相关推荐