百川发布新一代医疗增强大模型M4，登顶HealthBench全球第一

志斌 • 4小时前 • 人工智能

大模型之家讯近日，百川智能与清华大学研究团队联合发布新一代医疗增强大模型 Baichuan-M4。该模型在 OpenAI 提出的权威医疗评测 HealthBench 及其 Hard、Professional 三个子榜单上同时位列世界第一，综合得分 68.6，全面超越 GPT-5.5、Claude Opus 4.7、DeepSeek-V4-Pro 等国际顶尖模型，幻觉率低至 3.3%，为全行业最低。

百川发布新一代医疗增强大模型M4，登顶HealthBench全球第一

M4 的核心突破在于四项贴近真实临床的能力。在深度问诊方面，M4 能够像临床医生一样主动追问患者，引导其提供完整病程信息，而非被动等待答案。其联合 150 多位一线医生构建的动态问诊评测体系 SCAN-bench 显示，M4 初诊得分 79.0、复诊得分 74.7，均明显领先 GPT-5.5 等竞品。在全病程记忆方面，M4 打通历史病历、多轮问诊、化验趋势与用药反馈，长上下文临床记忆评测得分 86.9，为同类最高，较上一代 M3 提升 21.1 分。

百川发布新一代医疗增强大模型M4，登顶HealthBench全球第一

在循证医学层面，百川首创的「证据锚定」要求模型每一句医学结论都精确对应到原始论文或指南具体段落。依托六源循证范式，M4 的循证引用精度达 90.0，远超 GPT-5.5 的 54.7 和 OpenEvidence 的 55.9。此外，百川面向医疗场景构建的 Baichuan-Harness Agent 架构，将问诊、记忆、循证编排为完整的医疗智能体，可自主完成连续诊疗，无需人工逐步指令。

百川发布新一代医疗增强大模型M4，登顶HealthBench全球第一

百川表示，从 M1 到 M4，团队始终聚焦于让 AI 真正能看病。目前全球顶尖大模型公司均已竞逐医疗赛道，M4 在严肃医疗场景中给出了目前业界最好的答卷，正在将优质诊疗资源带到更多人身边。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/16507

赞 (0)

0 0

Gartner®️全球认可！商汤获评生成式AI计算机视觉前沿技术创新者

上一篇 10小时前

智联万物 AI赋未来！2025电博会即将开幕！

下一篇 2025年9月12日下午3:25

人工智能

商汤科技携手中国银行，共创“AI+金融”新模式

大模型之家讯本周，第六届中国国际进口博览会（以下简称“进博会”）在上海隆重举办。商汤科技第二次亮相进博会，向世界展现中国人工智能技术创新成果。同时，在本届进博会中，商汤科技还与中…

志斌
2023年11月9日
人工智能

翻译、穿搭、景点不再踩坑文心一言APP 旅游智能体用户首日暴增12倍

大模型之家讯 “以前出去玩之前要做很多功课，现在有了AI，一切都变得简单了。”5月2日，一位到北京旅游的武汉大三学生小许表示，“AI不仅能推荐适合我的旅游景点，还能帮我规划行程、进…

志斌
2024年5月2日
人工智能

阿里云栖大会：发布六款新模型与全新语音品牌，覆盖多模态与行业应用

大模型之家讯今日，在阿里云栖大会上，阿里云集中发布六款大模型新品及一个全新语音品牌，涵盖文本、视觉、语音、视频、代码与图像等核心场景，展现其在大模型全栈能力上的最新进展。此次发…

志斌
2025年9月24日
人工智能

从“数据融合”迈向“原生架构”：商汤发布 NEO 架构，重新定义多模态模型效能边界

大模型之家讯商汤科技正式发布并开源了与南洋理工大学 S-Lab合作研发的全新多模态模型架构 —— NEO，为日日新 SenseNova 多…

志斌
2025年12月2日
人工智能

新范式：AIGC推动的数据要素产业价值促进创新

大模型的发展与数据要素的价值创造互为因果，LLM正推动着数据要素以“激发AGI”的全新范式创造价值。如何有效地整合规模化、高质量的数据以用于大型模型的训练，不仅是推进大模型发展的窗…

王昊达
2024年8月8日
人工智能

实测告诉你：DeepSeek-R1 7B、32B、671B差距有多大？

差不多是“牛肉风味肉卷”和“牛肉卷”的差距

志斌
2025年2月11日
人工智能

豆包1.5深度思考模型面世，多模态技术重塑企业应用边界

大模型之家讯 4月17日，在FORCE LINK AI创新巡展·杭州站上，火山引擎正式发布了一系列AI技术成果，涵盖大模型、Agent工具及云基础设施，旨在帮助企业以更高效、低成本…

志斌
2025年4月17日
人工智能

阶跃星辰发布桌面智能伙伴“小跃”，开启邀请测试

大模型之家讯 9月24日，阶跃星辰正式发布了旗下桌面智能 Agent 产品“阶跃 AI 桌面伙伴”，昵称“小跃”。该产品定位为常驻桌面右上角的轻量化助手，支持多任务并行处理，能够在…

志斌
2025年9月24日
人工智能

商汤科技宣布战略重组，聚焦AI云与通用视觉模型

大模型之家讯 12月3日晚间，商汤科技董事长兼CEO徐立发布内部信，宣布公司已顺利完成战略重组。未来，商汤科技将聚焦核心业务AI云以及通用视觉模型，而智能汽车“绝影”、家庭机器人“…

志斌
2024年12月3日
人工智能

多芯片全覆盖，优刻得推出新一代GPU虚拟化技术

大模型之家讯在算力成为企业核心生产力的大背景下，GPU资源紧张、采购昂贵、利用率不均衡等问题正成为AI落地的最大掣肘。针对这些行业痛点，优刻得正式发布新一代GPU虚拟化技术，通…

志斌
2025年12月1日

发表回复

登录后才能评论

志斌

数码科技领域深耕多年的专业管理者与技术服务专家，现任大模型之家主编、速途网资深编辑、元宇宙研究院分析师。专注于人工智能、消费电子与IDC行业的深度报道，凭借广泛科技圈人脉，包括媒体、公关、分析师及企业高层，持续引领行业洞察与分析。商务合作咨询： Qiaodao007

1.4K posts

0 comments