谷歌开源MedGemma1.5:医疗AI实现三维影像分析关键突破

2026.04.17 10:20
近日谷歌开源医疗AI模型MedGemma1.5,核心突破在于原生支持CT、MRI三维扫描及病理学数字切片分析,能精准处理高维度医疗数据,在胸部X光标注等场景表现优异。该模型开源后将推动医疗AI技术普惠,助力基层诊断效率提升。

医疗影像分析是AI在医疗领域落地的核心场景之一,但传统模型大多聚焦二维影像处理,对CT、MRI这类三维数据的解析能力有限;加上多数商业模型采用闭源模式,技术的普及和迭代也受到了限制。最近,谷歌开源了医疗AI模型MedGemma1.5,它以处理高维度医疗数据为核心突破点,给行业带来了新的技术选择。

MedGemma1.5的核心能力集中在三个方面:首先,它原生支持CT和MRI三维扫描数据,不用把立体影像拆成二维切片就能直接分析,能捕捉病灶在空间中的位置、大小以及和周围组织的关联信息,减少信息丢失;其次,它支持病理学数字切片的微观分析,能识别细胞形态异常、组织病变等细节,满足病理诊断的高精度要求;另外,在胸部X光分析上,它能实现精准标注,自动识别肺部结节、肺炎等常见病变。

从技术层面看,MedGemma1.5基于谷歌Gemma基础模型架构优化而来,针对医疗数据高维度、多模态的特点,调整了输入层和特征提取模块。它采用分层注意力机制处理三维影像的空间信息,同时引入领域自适应预训练策略,用大量标注医疗数据做微调,保证在专业场景下性能稳定。而且,模型保持了轻量化设计,可以部署在普通医疗工作站上,降低了硬件门槛。

这个模型开源的意义在于打破技术壁垒,让全球的医疗机构和科研团队都能自由使用并进行二次开发。对基层医疗场景来说,MedGemma1.5能帮助那些缺乏高端设备和专业人才的机构提升诊断效率;在科研领域,开源模式会加速医疗AI算法的迭代,推动更多创新应用落地。

行业动态上,国际医疗AI研究联盟最近发布的《2024年医疗AI开源趋势报告》显示,过去一年里开源医疗AI模型的应用覆盖率增长了27%,其中三维影像处理类模型的需求增速最快;竞争对手方面,OpenAI的GPT-4V模型在医疗影像识别任务中表现不错,但目前还是闭源商业服务;国内的百度文心医疗大模型最近更新了二维影像分析模块,它的三维处理功能预计2024年第四季度上线,会和MedGemma1.5形成直接竞争。

作品声明:内容由AI生成