谷歌重磅推出开源医疗模型MedGemma：医疗影像与文本分析“杀手锏”

摘要：谷歌表示，MedGemma基于Gemma3架构，专为医疗健康领域设计，旨在通过无缝结合医学图像和文本数据的分析，来增强医疗健康应用，提升医疗诊断与治疗的效率。MedGemma在多种图像和文本应用中表现出色，因此开发者可以调整这些模型以适配他们自己的健康应用程序

在刚刚结束的2025年 I/O 开发者大会上，谷歌推出全新AI模型——Gemma 3n，该模型经过优化，可在智能手机、笔记本电脑和平板电脑上高效运行。

与此同时，谷歌还发布了MedGemma，这是其“健康人工智能开发者基础”（Health AI Developer Foundations）计划的最新成员。

谷歌表示，MedGemma基于Gemma3架构，专为医疗健康领域设计，旨在通过无缝结合医学图像和文本数据的分析，来增强医疗健康应用，提升医疗诊断与治疗的效率。MedGemma在多种图像和文本应用中表现出色，因此开发者可以调整这些模型以适配他们自己的健康应用程序。

MedGemma提供两种配置，针对特定的医疗需求：

MedGemma 4B：拥有40亿参数的多模态模型，主要用于医学图像的分类和解读。它采用了SigLIP图像编码器，该编码器在去标识化的医学数据集上进行了预训练，这些数据集包括胸部X光片、皮肤病学图像、眼科学图像和组织病理学切片，使其在处理复杂医学图像方面表现出色。其语言模型组件则在多样化的医学数据上进行训练，从而能够全面理解复杂的医疗情境。MedGemma 27B：拥有270亿参数的纯文本模型，针对需要深度医学文本理解和临床推理的任务进行了优化。该版本专门经过指令微调，适用于需要高级文本分析的应用，为临床推理提供支持，并帮助医务人员更快地做出决策。

开发者可以通过Hugging Face访问MedGemma模型，但需同意“健康AI开发者基础”（Health AI Developer Foundations）的使用条款。这些模型可以在本地运行以进行实验，也可以通过谷歌云的Vertex AI部署为可扩展的HTTPS端点，用于大规模应用。

此外，谷歌鼓励开发者针对特定用例对模型进行验证和微调，并提供相关指导和工具，以支持在适配过程中采用提示工程（prompt engineering）、上下文学习（context learning）和LoRA等方法进行高效的参数微调。

MedGemma模型的推出有望彻底改变医疗实践和研究——

医学图像分类：4B模型的预训练使其适用于对各种医学图像进行分类，例如放射影像扫描和皮肤病学图像。医学图像解读：可以生成与医学图像相关的报告或回答相关问题，辅助诊断过程。临床文本分析：27B模型擅长理解和总结临床记录，支持患者分诊和决策支持等任务。

这些功能不仅提高了诊断准确性，还简化了医疗机构的工作流程，有助于改善患者预后。

通过为医疗AI开发提供易于获取的开源工具，MedGemma使开发者能够创建无缝集成医学图像和文本分析的应用，为初创企业和医疗服务提供商开辟了新的可能性，使他们能够将AI驱动的诊断和患者分析功能集成到自己的应用程序中，成为多模态医疗文本和图像理解集成方面的一次飞跃。

来源：大健康派

标签：模型谷歌开源医疗 medgemma

本文地址：http://news.43b.com.cn/a/242914.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!