阿里通义千问发布 QwQ-32B-Preview 开源 AI 推理新王
11 月 28 日,阿里通义千问正式推出全新实验性研究模型 QwQ-32B-Preview,旨在提升人工智能在数学和编程领域的推理能力。这款模型在深度推理的复杂问题上表现卓越,不仅成为少数可与 OpenAI o1 模型匹敌的 AI,还成为第一个以 Apache 2.0 许可证开放下载的模型,为其商业化应用铺平道路。
阿里团队在博客中提到,QwQ 的名称寓意“思考、质疑与理解”,象征着人类探索未知的追求。官方将其比喻为一位好奇学徒,用智慧和问题照亮通向未来的道路。QwQ-32B-Preview 配备 325 亿个参数,支持处理 32000 tokens 的超长文本输入,其开发目的是为研究者、企业及开发者提供一个强大的推理工具。
在多个权威测试基准中,QwQ-32B-Preview 展示了强大的推理和解决问题能力:MATH-500:在这一全面考察数学解题能力的评测集中,QwQ-32B-Preview 取得了 90.6% 的高分,在各类数学主题上的表现优异。
AIME:涵盖中学数学领域的综合测试,QwQ-32B-Preview 得分 50.0%,展现了卓越的数学推理技能。GPQA:评估科学问题解决能力的基准测试,QwQ-32B-Preview 评分 65.2%,达到研究生水平的科学推理能力。LiveCodeBench:这一基准测试模拟真实编程场景的代码生
QwQ-32B-Preview 是首个以宽松许可证(Apache 2.0)开放的强推理模型。开发者不仅可以在生产环境中应用,还能自由调整和优化模型。这种开放模式无疑为 AI 技术的普及与创新带来了更广阔的空间。