摘要:近年来,随着科学技术的不断发展进步,AI已经成为了大家耳熟能详的“热点”词汇,特别是春节前国产大模型Deepseek的爆火,更是引发大家使用人工智能的热潮。
近年来,随着科学技术的不断发展进步,AI已经成为了大家耳熟能详的“热点”词汇,特别是春节前国产大模型Deepseek的爆火,更是引发大家使用人工智能的热潮。
有人使用Deepseek问各种问题,甚至用它来算命,还有些朋友,喜欢使用它来问各种健康问题,甚至希望能够用它通过症状诊断出疾病,并给出具体的解决方案,更有一些媒体为了吸引眼球,甚至给出了“Deepseek看病比医生还准”的标题,可这些人工智能语言大模型,真的能用来看病吗?这种AI对于疾病的诊断,真的靠谱吗?一项近日发表自在Nature子看上的新研究,或许能给我们一些启示。
首先应该明确的是,人工智能虽然发展如火如荼,但用AI替代人来诊断疾病还不现实。特别是在没有相关生理指标检查基础的情况下,仅凭症状判断疾病,不管是医生还是AI,都不可能给出准确的疾病诊断,更不要轻信一些AI一些结合症状判断给出的治疗用药方案。
在此次发表的新研究中,研究者对比了搜索引擎与多个AI大语言模型对于健康问题回答的准确率,时效性以及权威性等方面的信息,研究中共验证了150个医学问题,对比了4个搜索引擎和7个AI模型之间的回答结果。虽然研究中纳入的AI模型并不包括Deepseek,但其研究结果也是值得我们参考和深思的。
研究结果显示,ChatGPT等AI大语言模型,在回答医学问题正确率方面,完胜了搜索引擎,AI回答医学问题的平均正确率高达80%,相比传统搜索引擎其正确率提高了10%到30%,而且在回答问题的完整性,流畅度方面,人工智能大模型能够汇总出问题所需的有逻辑的完整答案,更像是人类回答的方式,相比搜索引擎需要汇总相关信息,并自己总结答案,在便捷性方面,也具有更大优势。
由此看来,用AI来咨询健康问题,或者是诊断疾病,是不是已经非常靠谱了呢?答案却并不如我们所愿,在这项研究中,还总结出了对于AI回答医学问题的几个重要缺陷,这也是今天想给大家重点分享的。
AI的时效性不如搜索引擎
在提供信息的时效性方面,AI给出的信息相比搜索引擎其时效性要更差,这的结果也是由AI智能体本身的特性所决定的。
通常通过搜索引擎搜索信息时,搜索引擎可以根据需要给出最新的相关互联网链接信息,我们能够通过搜索到的链接访问相应的网页,并识别其是否是最新的信息。但AI总结出的答案,则是通过AI已经接受过的训练数据 ,而经过类似“思考”的过程而给出的答案。
这种情况下,AI所提供的相关信息只能说基于AI本身的训练数据来说,是相对准确的,但往往对于一些最新更新的医学信息,AI的训练库并没有纳入的话,AI提供的信息可能就会存在一定的滞后性。
因此,如果我们想要获取最新的医学信息,或者最新的指南文献,有时候通过搜索引擎,或权威的学术网站搜索,可能比AI回答的结果会更准确可靠。
AI通常不给出数据具体来源
AI会给你问题的答案,甚至结合问题给出疾病诊断结果和解决方案,甚至包括了相关健康质量方案的有效性临床数据等,但这些数据往往不会标注信息的来源,作为提问者的我们,也就无从考证这些数据的准确性和来源。
有些情况下,AI的总结内容并不会严谨引用权威文献的数据,而是会结合AI被训练的数据库自己组织语言给出的“假数据”,这些数据实际上并不存在,因此,给出答案可能会对提问者形成误导。
简单来说,AI会根据它现有的“知识库”自己汇总语言,而在汇总语言的过程中,其引用的数据和资料,会被重新组织,导致出现“一本正经胡说八道”的现象,因此,对于AI给出的相关健康信息或解决方案,我们更要仔细甄别,不能一味地信任AI给出的所有数据。
AI会模仿专家语气使人误解
在此次研究中发现,AI大语言模型对于医学问题给出的答案更加具体,更具逻辑性,当然这也是AI本身的优势所在。但反过来,这样的答案,更像是医学专家娓娓道来的详细解释,也更容易让提问者形成信赖以及依赖。
如果这些信息可靠,当然还好,但如果这些信息不靠谱,或者存在误导信息的话,那这种信任就会变成一种对健康问题的误解,如果提问者去执行一个错误的用药方案治疗一种并不对症的疾病,那带来的危害也是巨大的。
这项研究应该引发我们的深思,在人工智能时代,对于健康知识的获取来说,如何合理的使用AI,将是值得我们思考和探索研究的课题之一。
在目前的人工智能发展水平下,单纯依靠AI诊断疾病的方法,当然是不靠谱的,AI当然也不可能替代医生的临床地位,即使是我们咨询AI简单的健康问题,对于它给出的答案,也要画个问号,一个靠谱的方法是,对于AI给出的信息,在用传统的搜索引擎进行搜索验证,如果能够两相印证的信息,则是相对更靠谱的结果和答案。
此外,对于AI的合理使用,学会如何提问也很重要,结合自身的情况,科学合理的提出问题,并限定AI给出的答案必须引用真实存在权威指南或文献结果等,对于提高AI回答问题的准确度,也能够有所提升,篇幅有限,这里就不展开细说了。
人工智能时代,虽然AI给我们带来了很多便捷,但对于健康问题,我们还是要慎重的相信AI,科学理性的看待健康相关问题,并遵循合理的建议去调理治疗,AI回答的结果可以作为参考,但不可作为标准答案,您说是不是呢?
参考文献:
Fernández-Pichel, M., Pichel, J.C. & Losada, D.E. Evaluating search engines and large language models for answering health questions. npj Digit. Med.8, 153 (2025).
来源:李药师谈健康