百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview

2025-01-24 18:38:59   |   棠糖   |   2092

1月24日,百川智能正式发布国内首个全场景深度思考模型 Baichuan-M1-preview,成为目前唯一同时具备语言、视觉和搜索三大推理能力的模型。在数学、代码等多项权威评测中,该模型表现全面超越o1-preview,展现出强大的多领域推理能力。

Baichuan-M1-preview 在语言推理、视觉推理和搜索推理三大核心能力上表现出色。语言推理:在AIME、Math等数学基准测试,以及LiveCodeBench代码任务中的成绩均优于国内外同类模型,证明了其在复杂逻辑推理和精确计算上的能力。视觉推理:在MMMU-val和MathVista等权威视觉推理评测中,Baichuan-M1-preview 的表现超越了 GPT-4o、Claude3.5 Sonnet 等头部模型,展现出卓越的多模态推理能力。

为进一步推动AI技术在医疗领域的透明化和广泛应用,百川智能同步推出了行业首个开源医疗增强通用大模型 Baichuan-M1-14B。性能表现在cmexam、clinicalbench_hos等权威医学评测中,Baichuan-M1-14B的成绩超越了更大参数量的Qwen2.5-72B,并与o1-mini相差无几。数据构建百川智能收集了万亿级 token 的严肃医疗数据,包括中英文医学论文、真实病例、医疗问答和临床数据等,同时生成了超千亿 token 的多样化合成数据,涵盖复杂决策推理链条和问答对等形式。创新训练方法,模型训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段,结合ELO强化学习法优化思维链路径,有效提升了生成质量和逻辑推理能力。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview

2025-01-24 18:38:59 浏览量: 2092 作者: 棠糖

1月24日,百川智能正式发布国内首个全场景深度思考模型 Baichuan-M1-preview,成为目前唯一同时具备语言、视觉和搜索三大推理能力的模型。在数学、代码等多项权威评测中,该模型表现全面超越o1-preview,展现出强大的多领域推理能力。

Baichuan-M1-preview 在语言推理、视觉推理和搜索推理三大核心能力上表现出色。语言推理:在AIME、Math等数学基准测试,以及LiveCodeBench代码任务中的成绩均优于国内外同类模型,证明了其在复杂逻辑推理和精确计算上的能力。视觉推理:在MMMU-val和MathVista等权威视觉推理评测中,Baichuan-M1-preview 的表现超越了 GPT-4o、Claude3.5 Sonnet 等头部模型,展现出卓越的多模态推理能力。

为进一步推动AI技术在医疗领域的透明化和广泛应用,百川智能同步推出了行业首个开源医疗增强通用大模型 Baichuan-M1-14B。性能表现在cmexam、clinicalbench_hos等权威医学评测中,Baichuan-M1-14B的成绩超越了更大参数量的Qwen2.5-72B,并与o1-mini相差无几。数据构建百川智能收集了万亿级 token 的严肃医疗数据,包括中英文医学论文、真实病例、医疗问答和临床数据等,同时生成了超千亿 token 的多样化合成数据,涵盖复杂决策推理链条和问答对等形式。创新训练方法,模型训练分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段,结合ELO强化学习法优化思维链路径,有效提升了生成质量和逻辑推理能力。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号