摘要:4月7日,斯坦福以人为本人工智能研究所(HAI)发布《2025年AI指数报告》,这份长达456页的报告,全景展示了过去一年AI领域的关键进展。
4月7日,斯坦福以人为本人工智能研究所(HAI)发布《2025年AI指数报告》,这份长达456页的报告,全景展示了过去一年AI领域的关键进展。
以人为本人工智能研究所是斯坦福大学于2019 年成立的跨学科研究机构,由“AI教母”李飞飞联合领导,其每年发布的“AI指数报告”成为全球人士了解人工智能前沿发展的核心文件。
具体来看,今年的报告共列了研究与开发、技术性能、负责任的AI、经济、科学与医学、政策与治理、教育等8个章节,其中科学与医学占据43页内容。
在科学与医学中,报告重点介绍了2024年医学和生物学领域的AI里程碑,展示了AI在医学影像、临床试验、辅助诊断等领域的进展,彰显出AI在医疗保健的关键影响。
其中包括以下要点:
更大更好的蛋白质测序模型出现:2024年,包括ESM3和AlphaFold 3在内的几个大规模、高性能蛋白质测序模型被推出。AI继续推动科学发现的快速进步:2022年和2023年标志着AI驱动科学的早期阶段,2024年带来了更大的进展。
领先AI模型的临床知识持续提升:OpenAI最近发布的o1在MedQA基准测试中达到新的最先进水平96.0%——比2023年的最佳成绩提高了5.8个百分点。
AI在关键临床任务上超越了医生:一项新研究发现,仅GPT-4就能在诊断复杂临床病例方面胜过医生。其他研究显示,AI在癌症检测和识别高死亡风险患者方面也超过了医生。
FDA批准的AI医疗设备数量激增:FDA于1995年首次批准了人工智能驱动的医疗设备。到2015年,只有6种这样的设备获得批准,但到2023年,这一数字飙升至223种。
合成数据在医学领域显示出巨大的潜力:2024年发布的研究表明,人工智能生成的合成数据可以帮助模型更好地识别健康的社会决定因素,增强隐私保护的临床风险预测,并促进新药化合物的发现
医学出现基础模型:一批医学大模型于2024年发布,从通用多模态模型Med-Gemini到垂类专业模型EchoCLIP(心电图学)和ChexAgent(放射学)。
公开的蛋白质数据库规模不断扩大:自2021年以来,主要公共蛋白质科学数据库的条目数量显著增加,这对科学发现具有重要意义。
今年1月,李飞飞在接受采访时称,她对AI 在医疗健康领域的应用充满热情,“这是一个庞大的行业,从基础生物学研究,到临床诊断、医疗服务和公共卫生……令人振奋的是,在这个系统的每个环节,AI都能发挥重要作用。”
对AI医疗的看好,已经成为精英们的共识,此前木头姐表示医疗保健将成为AI最为深远的应用领域,甲骨文CEO拉里·埃里森、OpenAI首席执行官Sam Altman也以实际行动支持AI医疗发展。
得益于AI技术的发展,医疗健康领域正在经历一场深刻革命。
2024,AI医疗有哪些里程碑?
在“科学与医学”章节的开头,报告细数了过去一年AI在医疗和生物学领域的里程碑成果。
蛋白质序列优化:大语言模型来助力
尽管并非有意为之,但语言模型最近获得了一项新的生物能力:优化蛋白质序列。
传统上,蛋白质工程需要大量的实验室研究来改进序列以提高功能。然而,最近的一项研究发现,未经微调的语言模型在这一任务上变得异常有效。
研究人员采用定向进化的方法证明,语言模型能够生成在合成和实验适应度景观中均优于传统算法的蛋白质序列。
Aviary:为生物学任务训练Agent
FutureHouse是一家旨在实现科学发现过程自动化的公司,去年公司发布了Aviary,这是一个能够执行生物学研究中多步骤任务的代理,有望实现智力任务的自动化。
在Aviary框架下,AI Agent已经可以执行“操纵DNA 结构进行分子克隆、通过查阅科学文献来回答研究问题、构建蛋白质稳定性”等具有挑战性的科学任务。
结果显示,Aviary的支持下,基于开源大语言模型构建的智能体已经可以在多个任务上比肩甚至超越人类专家,为科学探索的自动化进一步铺平道路。
AlphaProteo :AI用于新型高亲和力蛋白结合剂
AlphaProteo是谷歌DeepMind开发的模型,专注于创建能够与特定目标分子结合的新型高亲和力蛋白结合剂。
AlphaProteo设计了多个目标蛋白的首个结合剂,包括与癌症和糖尿病相关的VEGF-A蛋白,在测试的七个目标蛋白上比现有任何方法的有效性高出300倍。
AlphaProteo的结合剂也比使用现有最先进设计方法创建的结合剂牢固约10倍,这是一项真正的生物工程突破,该模型正被用于药物开发、诊断和生物技术应用。
人脑图谱:重建人类大脑的一小部分
谷歌的一个团队在突触水平上重建了人类大脑的一小部分——《连线》杂志称赞这是“迄今为止最详细的脑连接图”。
该样本取自一名癫痫患者手术中左侧前颞叶,使用多束扫描电子显微镜成像。超过5000个薄约30纳米的切片捕捉到了约57000个细胞——包括神经元、胶质细胞和血管——以及1.5亿个突触。
该项目标志着在理解神经回路方面迈出了重要一步,并可能为未来的神经治疗提供参考。
虚拟AI实验室:加强生物医学研究
最近斯坦福大学引入了一个虚拟的人工智能实验室,在这个实验室中,多位“AI科学家”专注于不同的学科,并作为自主代理进行协作。
在实验中,人类研究员委托这个AI实验室设计能够与导致病毒结合的纳米抗体片段,该实验室生成了92个纳米抗体,其中超过90%在验证研究中成功与病毒结合。
这项研究的真正意义不在于其具体发现,而在于证明了一个完全自主的、由语言模型驱动的实验室可以产生有意义的科学发现。
GluFormer:使用AI进行持续血糖监测
GluFormer是由英伟达、魏茨曼研究所等机构开发的基础模型,基于近11000名个体的超过1000万次血糖测量数据训练而成,通过分析连续血糖监测(CGM)数据来预测长期健康结果。
GluFormer可以在症状出现之前识别出有糖尿病风险或血糖控制恶化的个体。在一项为期12年、涉及580名成年人的研究中,它准确地标记了66%的新发糖尿病病例和69%的心血管相关死亡病例。
像GluFormer这样的模型将使糖尿病护理从被动治疗转向主动预防,从而实现更早的临床干预。
ESM3:模拟进化过程以生成新的蛋白质
EvolutionaryScale的ESM3是一种开创性的模型,基于27.8亿个蛋白质序列进行了训练,拥有980亿个参数,旨在通过模拟进化过程生成新型蛋白质。
ESM3最显著的成就之一是设计了esmGFP,这是一种新的人工绿色荧光蛋白,公司估计自然界需要5亿年才能发展出这种蛋白。这是通过人类引导的思维链提示实现的。
ESM3还是开源的,促进了合成生物学和蛋白质工程项目的合作,应用于药物发现、材料科学和环境工程。
AlphaFold3:预测所有生命分子的结构和相互作用
谷歌DeepMind和Isomorphic Lab的最新成果——AlphaFold 3,不仅预测蛋白质结构,还更精确地模拟其与关键生物分子(DNA、RNA、配体、抗体)的相互作用。
AlphaFold 3通过建模小分子与蛋白质的相互作用,加速了药物开发,这对于疾病研究至关重要。此外,AlphaFold 3的开源赋予了全球科学家力量。
AI席卷医疗:从研发到临床
蛋白质,是AI赋能生命科学的核心领域,过去一年,应用于蛋白质序列的AI模型取得了显著进展。
一个明显的趋势是模型的训练规模越来越大,这些由AI驱动的方法通过减少对昂贵且耗时的实验方法的依赖,加速了蛋白质功能和设计的探索。
这一过程中,各种公共蛋白质科学数据库中的条目数量也随着时间的推移稳步增长。这些数据库成为研究者不可或缺的工具,然而保持数据质量和防止模型偏差仍然是持续的挑战。
目前,AI驱动的蛋白质研究数量显著增长,这些研究集中在功能预测(8.4%)、蛋白质结构预测(7.6%)和蛋白质-药物相互作用(3.0%)等几个关键领域。
此外,图像和多模态的人工智能也被用于科学发现,冷冻电镜、高通量荧光显微镜和全切片成像技术的进步,使科学家能够以高精度检查和分析原子、亚细胞环境及组织水平的结构,揭示复杂生物过程的新见解。
在药物研发流程中,临床试验是最为耗时且花费最大的阶段,近年来运用AI的临床试验数量正在稳步上升。
去年,中国AI临床试验的数量达到105项,超过美国(97项)排名世界第一,紧随其后的是意大利(42项)、土耳其(30项)、英国(24项)等。
临床方面,AI在医学影像领域的应用正在迅速发展,扩展到新的数据模式,并解决日益复杂的临床问题。
统计显示,超过80%的FDA批准的机器学习软件都针对医学图像的分析。近年来,医学影像领域的大模型急剧增加,尤其是病理领域,基础模型数量显著增加。
然而,尽管该领域取得了一些成绩,许多医学影像中的AI仍然依赖于高度有限的训练数据集,特别是在三维成像领域。
为了训练更为稳健的医学影像AI模型,需要更大、更全面且多队列的数据集,通过提升高质量、标记好的训练数据的可用性,预计模型性能会得到增强。
此外,在临床实践中,大语言模型的崛起为医学决策、辅助诊断、患者护理、病历管理等方面带来变革。
一个具有代表性的情况便是AI在MedQA基准测试(其中包含超过60000个临床问题)的表现已显著提升。
微软和OpenAI的研究团队最近测试了o1,取得了新的最高分96.0%——比2023年创下的记录提高了5.8个百分点。自2022年底以来,基准测试的表现提高了28.4个百分点。
行业对语言模型在医疗保健任务上的兴趣激增,在PubMed中“大型语言模型”一词的检索结果为1566篇,仅2024年就发表了1210篇。
目前大语言模型已经在临床决策上展现出强大实力,一项涉及92名医生的随机对照试验显示,GPT-4独立运行的决策水平与使用GPT-4进行辅助决策的人类医生表现相当。
临床文档长期以来一直是医生沉重负担的来源,如今AI正在解决这一难题。
斯坦福大学的研究人员进行了一项完全集成的自动化AI速记系统测试,结果显示医生的采用率高达55%,AI速记使得每条记录节省了约30秒的时间,医生的负担和倦怠分别平均减少了35%和26%。
这些发现表明,由AI驱动的速记技术可以显著改善医生的工作流程和福祉,既节省时间又减轻行政负担。
报告进一步表示,AI融入电子健康记录系统可以简化临床工作流程,提升医护人员和患者的体验并减轻医疗负担。主要供应商——Epic、Oracle Health、Meditech和TruBridge已广泛采用AI。
近年来AI在医疗保健中的显著影响,从FDA授权数量也能得到体现。
统计显示,自2015年起,FDA每年批准的AI医疗器械数量呈现指数级增长,到2023年已达到223款。
来源:小柯要加油一点号