百川智能将发布新一代医疗大模型幻觉率降至3.3%

2026-05-27 07:40:05 来源：新经网作者：冯思韵

很多朋友不知道【百川智能将发布新一代医疗大模型幻觉率降至3.3%】，今天小绿就为大家解答一下。

百小医

　　强循证：临床诊断有严格的循证路径，不是“根据症状猜一个最可能的病”。通用模型缺乏系统性的循证推理能力。《JAMA Network Open》2026年评测了21款主流大模型在29个标准化临床案例中的表现，鉴别诊断阶段的错误率普遍超过 80%——不按指南逻辑层层排除，而是过早锁定一个答案。

百小医

　　【CNMO科技消息】近日，在清华大学百川楼举办的“AI医疗新范式”学术论坛上，百川智能创始人兼CEO王小川展示了即将发布的新一代医疗大模型Baichuan-M4与AI家庭医生“百小医”。

　　百川即将发布的AI家庭医生“百小医”，产品核心定位是，“明明白白看医生，安安心心管家人”。它将基于微信生态运作，在对话中捕捉并结构化每个人的身体状态、用药历史和检查数据，识别日常闲聊中的高危信号，主动提醒复诊和用药等行为。

　　据CNMO科技了解，新一代医疗大模型Baichuan-M4，在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一，超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro等模型。依托原创的事实性感知强化学习算法，Baichuan-M4将裸模型的事实性幻觉率降至3.3%。

　　三条刚需，通用模型一条都不达标。为此，百川在M系列医疗专用大模型做了针对性的优化。

　　王小川将医疗对大模型的刚性要求总结为三点：

　　会提问：任何受过训练的医生都不会在患者说完第一句话时就下结论。牛津大学2026年发表于《Nature Medicine》的研究揭示了一个关键差距：AI读标准化病历时准确率可达94.9%，但真实患者自助使用时骤降至34.5%。原因在于患者描述往往不完整，而通用模型不会像医生一样追问。

　　低幻觉：医疗容不得编造，一个错误判断可能危及生命。《BMJ Open》2026年的研究系统评估了主流通用模型的医疗回答，约50%被评为“有问题”，近20%属于“高度有问题”。通用模型当前的幻觉率在严肃医疗场景下不可接受。

以上问题已经回答了。如果你想了解更多，请关新经网网站 (https://www.xinhuatone.com/)

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关推荐