在近日于清华大学百川楼举办的“AI 医疗新范式”学术论坛上,多位知名院士专家与百川智能创始人兼CEO王小川共话AI医疗,王小川在会上披露了公司新一代医疗大模型 Baichuan-M4 与AI家庭医生“百小医”的最新进展。
王小川提出,百川看到了AI进入医疗在技术、产品、信任三个维度的问题。首先是技术,这也是当天论坛上被反复提及的行业现实:过去一年,通用大模型被大规模用于医疗健康咨询,规模已达数千万人次。患者发烧问 AI,孩子起疹子问 AI,拿到体检报告看不懂也问 AI。但这些场景下,来自一线临床的反馈却并不好。多位与会嘉宾指出,通用模型的回答听起来流利、看起来专业,实际上经常“看似对、实际危险”——大模型幻觉被包装成了确定性,患者带着 AI 给的“诊断”走进诊室质疑医生,医患矛盾反而加剧。
王小川认为,AI 真正进入医疗,必须依靠医疗增强大模型。他提出,医疗场景下对于大模型有三方面的刚性要求,包括低幻觉、强循证和会提问。
低幻觉,指医疗场景中容不得内容编造,一个错误判断可能危及生命。强循证,是指临床诊断有严格的循证路径,不是“根据症状猜一个最可能的病”,而通用模型缺乏系统性的循证推理能力。会提问,只指任何受过训练的医生都不会在患者说完第一句话时就下结论。
根据牛津大学2026年发表于《Nature Medicine》的研究、医学研究期刊《BMJ Open》等国际机构的评估,在这三方面要求中,通用模型均不达标。作为专注医疗的大模型公司,百川推出的M系列医疗专用大模型,则瞄准了这些刚性要求。依托原创的事实性感知强化学习算法,Baichuan-M4 将裸模型的事实性幻觉率降至 3.3%,创下全球新低。在循证路径上,M4 将权威医学指南拆解为千余条原子化临床路径,每一条由顶尖临床专家定义与校验。深度问诊能力方面,该模型不仅能像临床医生一样步步追问,更拥有超长记忆,托起患者长周期的健康管理。
这些底层能力也为其吸引了来自国际的目光。此前,全球最大稳定币公司Tether进军AI医疗时,从 OpenAI、量化巨头 Ubiquant AI 与百川三个候选中选定了百川的上一代医疗模型作为唯一教师模型(教师模型是指在人工智能模型训练中,作为“老师”提供知识与指导的预训练模型,用于通过知识蒸馏等方式训练和提升其他模型的性能)。
据悉,北京儿童医院、中国医学科学院肿瘤医院、上海交通大学医学院附属瑞金医院等三家国内顶尖医院已与百川联合开展临床研究,联合推出的AI儿科医生、 AI慢阻肺初筛工具等产品已经陆续上线试运行。以AI 筛查工具“咳搜”为例,患者只需一部手机,录制3分钟咳嗽音,即可完成高精度的慢阻肺初筛。
论坛圆桌环节,中国工程院院士、耳鼻咽喉头颈外科专家韩德民,中国工程院院士、生殖医学专家乔杰,中国科学院院士、心血管流行病学与遗传流行病学专家顾东风,中国工程院院士、眼科学专家王宁利等四位院士围绕“AI能否替代医生”“AI是否加剧医患矛盾”等话题同台讨论,他们从各自的临床领域给出了相似的判断:AI不能替代医生,但需要以专用模型、深入临床、真实验证的方式进入医疗领域。







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论