摘要:最近,AI医疗领域消息不断,前有OpenAI发布了HealthBench 模型,美股AI医疗龙头 Hims&Hers Health、Tempus、Grail、Doximity也纷纷随之大涨。日前,Kimi也开始积极布局“AI + 医疗”,AI成为医疗领域落地的
最近,AI医疗领域消息不断,前有OpenAI发布了HealthBench 模型,美股AI医疗龙头 Hims&Hers Health、Tempus、Grail、Doximity也纷纷随之大涨。日前,Kimi也开始积极布局“AI + 医疗”,AI成为医疗领域落地的首选领域。
5月27日,夸克发布了健康大模型,并表示在12门国家副主任医师职称考试中成绩超过了合格线。这也意味着,大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的一步。
此次副主任医师职称考试评测覆盖了12个常用学科,包括:全科医学、普通内科学、普通外科学、妇产科学、小儿内科学、肿瘤内科学、口腔医学、耳鼻咽喉科学、眼科学、皮肤与性病学、精神病学、麻醉学。
在上述学科领域,夸克健康大模型均超过合格线,并在全科医学、肿瘤内科学、皮肤与性病学、精神病学4个学科达到主任医师及格线。
据夸克介绍,其健康大模型是以通义千问为基础,通过海量的高质量数据构建和多阶段后训练策略实现了此次突破。
用户在使用中会发现,对于严肃医疗问题,夸克会先分析后动态检索书籍、指南、药品说明书、医典论文等。
对题型维度的深入剖析显示,多选题与病例分析题是所有模型误判率最高的两类。个别通用基础模型在多选题上的正确率均不足60%,而夸克借助“医疗长思考”机制达到71%。在病例分析题中,夸克通过检索增强与分步推理组合策略,将正确率提升到了53%。
夸克健康算法工程师徐健表示,“机器通过考试并不意味着可以替代医生,但它展示了在辅助诊疗决策、循证检索与患者沟通方面的巨大潜力。我们将不断强化模型能力,帮助医生和患者提升诊疗效率,为用户在居家场景下提供更多健康管理能力”。
来源:财天COVER