百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview

2025-01-24 18:38:59 | 棠糖 | 2092

1月24日，百川智能正式发布国内首个全场景深度思考模型 Baichuan-M1-preview，成为目前唯一同时具备语言、视觉和搜索三大推理能力的模型。在数学、代码等多项权威评测中，该模型表现全面超越o1-preview，展现出强大的多领域推理能力。

Baichuan-M1-preview 在语言推理、视觉推理和搜索推理三大核心能力上表现出色。语言推理：在AIME、Math等数学基准测试，以及LiveCodeBench代码任务中的成绩均优于国内外同类模型，证明了其在复杂逻辑推理和精确计算上的能力。视觉推理：在MMMU-val和MathVista等权威视觉推理评测中，Baichuan-M1-preview 的表现超越了 GPT-4o、Claude3.5 Sonnet 等头部模型，展现出卓越的多模态推理能力。

为进一步推动AI技术在医疗领域的透明化和广泛应用，百川智能同步推出了行业首个开源医疗增强通用大模型 Baichuan-M1-14B。性能表现在cmexam、clinicalbench_hos等权威医学评测中，Baichuan-M1-14B的成绩超越了更大参数量的Qwen2.5-72B，并与o1-mini相差无几。数据构建百川智能收集了万亿级 token 的严肃医疗数据，包括中英文医学论文、真实病例、医疗问答和临床数据等，同时生成了超千亿 token 的多样化合成数据，涵盖复杂决策推理链条和问答对等形式。创新训练方法，模型训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段，结合ELO强化学习法优化思维链路径，有效提升了生成质量和逻辑推理能力。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。