在医疗人工智能领域,百川智能再次取得突破性进展。其最新发布的Baichuan-M3 Plus大模型,在严肃医疗场景的问答准确性和可靠性方面,刷新了此前由M3模型保持的世界纪录。通过独创的六源循证技术与M3基座深度融合,M3 Plus将医学内容生成的幻觉率降至2.6%,这一数据不仅低于行业标杆Open Evidence,更成为全球最低水平。
该模型的核心创新在于"证据锚定"技术。不同于传统文献引用方式,这项技术要求模型生成的每句医学结论都必须精准对应原始论文或临床指南中的具体段落。为实现这一目标,研发团队构建了独立的训练体系,引入Citation Reward Model机制,对错误引用进行惩罚性训练。最终实现结论与证据匹配准确率超过95%,使AI生成的医学判断具备可核验、可追责、可教学的特性。
在性能优化方面,M3 Plus通过MoE架构重构、模型量化压缩和Gated Eagle-3投机解码等工程突破,在保持模型能力的前提下,将API调用成本较前代降低70%。这一改进为医疗场景的规模化应用扫清了关键障碍,目前开发者可申请限时15天的免费体验。
此前发布的M3基础模型已在Healthbench等权威评测中超越GPT-5.2,特别是在低幻觉领域以3.5%的指标领先全球。此次升级版M3 Plus将事实性幻觉率进一步压缩至2.6%,较GPT-5.2下降超30%,形成对Open Evidence等国际领先模型的全面超越。这项突破标志着中国在医疗AI领域的技术积累,正从跟随创新转向引领发展。
根据技术白皮书披露,M3 Plus的训练过程涉及超过2000万篇医学文献的深度解析,构建了包含1.2亿个证据节点的知识图谱。其独特的循证增强机制,使模型在肿瘤诊疗、罕见病诊断等复杂场景的表现显著优于通用大模型,为AI医疗的落地应用提供了新的技术范式。




