百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview
1月24日,百川智能正式发布国内首个全场景深度思考模型 Baichuan-M1-preview,成为目前唯一同时具备语言、视觉和搜索三大推理能力的模型。在数学、代码等多项权威评测中,该模型表现全面超越o1-preview,展现出强大的多领域推理能力。
Baichuan-M1-preview 在语言推理、视觉推理和搜索推理三大核心能力上表现出色。语言推理:在AIME、Math等数学基准测试,以及LiveCodeBench代码任务中的成绩均优于国内外同类模型,证明了其在复杂逻辑推理和精确计算上的能力。视觉推理:在MMMU-val和MathVista等权威视觉推理评测中,Baichuan-M1-preview 的表现超越了 GPT-4o、Claude3.5 Sonnet 等头部模型,展现出卓越的多模态推理能力。
为进一步推动AI技术在医疗领域的透明化和广泛应用,百川智能同步推出了行业首个开源医疗增强通用大模型 Baichuan-M1-14B。性能表现在cmexam、clinicalbench_hos等权威医学评测中,Baichuan-M1-14B的成绩超越了更大参数量的Qwen2.5-72B,并与o1-mini相差无几。数据构建百川智能收集了万亿级 token 的严肃医疗数据,包括中英文医学论文、真实病例、医疗问答和临床数据等,同时生成了超千亿 token 的多样化合成数据,涵盖复杂决策推理链条和问答对等形式。创新训练方法,模型训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段,结合ELO强化学习法优化思维链路径,有效提升了生成质量和逻辑推理能力。