谷歌开源MedGemma1.5：医疗AI实现三维影像分析关键突破

2026.04.17 10:20

近日谷歌开源医疗AI模型MedGemma1.5，核心突破在于原生支持CT、MRI三维扫描及病理学数字切片分析，能精准处理高维度医疗数据，在胸部X光标注等场景表现优异。该模型开源后将推动医疗AI技术普惠，助力基层诊断效率提升。

医疗影像分析是AI在医疗领域落地的核心场景之一，但传统模型大多聚焦二维影像处理，对CT、MRI这类三维数据的解析能力有限；加上多数商业模型采用闭源模式，技术的普及和迭代也受到了限制。最近，谷歌开源了医疗AI模型MedGemma1.5，它以处理高维度医疗数据为核心突破点，给行业带来了新的技术选择。

MedGemma1.5的核心能力集中在三个方面：首先，它原生支持CT和MRI三维扫描数据，不用把立体影像拆成二维切片就能直接分析，能捕捉病灶在空间中的位置、大小以及和周围组织的关联信息，减少信息丢失；其次，它支持病理学数字切片的微观分析，能识别细胞形态异常、组织病变等细节，满足病理诊断的高精度要求；另外，在胸部X光分析上，它能实现精准标注，自动识别肺部结节、肺炎等常见病变。

从技术层面看，MedGemma1.5基于谷歌Gemma基础模型架构优化而来，针对医疗数据高维度、多模态的特点，调整了输入层和特征提取模块。它采用分层注意力机制处理三维影像的空间信息，同时引入领域自适应预训练策略，用大量标注医疗数据做微调，保证在专业场景下性能稳定。而且，模型保持了轻量化设计，可以部署在普通医疗工作站上，降低了硬件门槛。

这个模型开源的意义在于打破技术壁垒，让全球的医疗机构和科研团队都能自由使用并进行二次开发。对基层医疗场景来说，MedGemma1.5能帮助那些缺乏高端设备和专业人才的机构提升诊断效率；在科研领域，开源模式会加速医疗AI算法的迭代，推动更多创新应用落地。

行业动态上，国际医疗AI研究联盟最近发布的《2024年医疗AI开源趋势报告》显示，过去一年里开源医疗AI模型的应用覆盖率增长了27%，其中三维影像处理类模型的需求增速最快；竞争对手方面，OpenAI的GPT-4V模型在医疗影像识别任务中表现不错，但目前还是闭源商业服务；国内的百度文心医疗大模型最近更新了二维影像分析模块，它的三维处理功能预计2024年第四季度上线，会和MedGemma1.5形成直接竞争。

作品声明：内容由AI生成