谷歌重磅推出开源医疗模型MedGemma:医疗影像与文本分析“杀手锏”

B站影视 内地电影 2025-05-22 09:49 1

摘要:谷歌表示,MedGemma基于Gemma3架构,专为医疗健康领域设计,旨在通过无缝结合医学图像和文本数据的分析,来增强医疗健康应用,提升医疗诊断与治疗的效率。MedGemma在多种图像和文本应用中表现出色,因此开发者可以调整这些模型以适配他们自己的健康应用程序

在刚刚结束的2025年 I/O 开发者大会上,谷歌推出全新AI模型——Gemma 3n,该模型经过优化,可在智能手机、笔记本电脑和平板电脑上高效运行。

与此同时,谷歌还发布了MedGemma,这是其“健康人工智能开发者基础”(Health AI Developer Foundations)计划的最新成员。

谷歌表示,MedGemma基于Gemma3架构,专为医疗健康领域设计,旨在通过无缝结合医学图像和文本数据的分析,来增强医疗健康应用,提升医疗诊断与治疗的效率。MedGemma在多种图像和文本应用中表现出色,因此开发者可以调整这些模型以适配他们自己的健康应用程序。

MedGemma提供两种配置,针对特定的医疗需求:

MedGemma 4B:拥有40亿参数的多模态模型,主要用于医学图像的分类和解读。它采用了SigLIP图像编码器,该编码器在去标识化的医学数据集上进行了预训练,这些数据集包括胸部X光片、皮肤病学图像、眼科学图像和组织病理学切片,使其在处理复杂医学图像方面表现出色。其语言模型组件则在多样化的医学数据上进行训练,从而能够全面理解复杂的医疗情境。MedGemma 27B:拥有270亿参数的纯文本模型,针对需要深度医学文本理解和临床推理的任务进行了优化。该版本专门经过指令微调,适用于需要高级文本分析的应用,为临床推理提供支持,并帮助医务人员更快地做出决策。

开发者可以通过Hugging Face访问MedGemma模型,但需同意“健康AI开发者基础”(Health AI Developer Foundations)的使用条款。这些模型可以在本地运行以进行实验,也可以通过谷歌云的Vertex AI部署为可扩展的HTTPS端点,用于大规模应用。

此外,谷歌鼓励开发者针对特定用例对模型进行验证和微调,并提供相关指导和工具,以支持在适配过程中采用提示工程(prompt engineering)、上下文学习(context learning)和LoRA等方法进行高效的参数微调。

MedGemma模型的推出有望彻底改变医疗实践和研究——

医学图像分类:4B模型的预训练使其适用于对各种医学图像进行分类,例如放射影像扫描和皮肤病学图像。医学图像解读:可以生成与医学图像相关的报告或回答相关问题,辅助诊断过程。临床文本分析:27B模型擅长理解和总结临床记录,支持患者分诊和决策支持等任务。

这些功能不仅提高了诊断准确性,还简化了医疗机构的工作流程,有助于改善患者预后。

通过为医疗AI开发提供易于获取的开源工具,MedGemma使开发者能够创建无缝集成医学图像和文本分析的应用,为初创企业和医疗服务提供商开辟了新的可能性,使他们能够将AI驱动的诊断和患者分析功能集成到自己的应用程序中,成为多模态医疗文本和图像理解集成方面的一次飞跃。

来源:大健康派

相关推荐