DeepSeek V3迎来”小版本升级" 性能直逼V3.5

2025-03-25 15:40:03   |   唐薇   |   2152

3月25日,深度求索公司近日低调推出了DeepSeek V3-0324版本更新。尽管官方将其称为"小版本升级",但实测表现却远超预期,被开发者评价为"堪比V3.5级别"的重大提升。

在开发者Xeophon的个人基准测试中,新版模型在所有指标上均有大幅提升,成为该测试框架下表现最佳的非推理模型。测试显示,该模型不仅能轻松应对4维空间超立方体等复杂数学问题,在编程任务上也展现出惊人实力——仅凭一句提示词就能开发出完整的自适应产品着陆页,性能被认为与Claude 3.7 Sonnet相当。

值得注意的是,虽然DeepSeek-V3-0324并非专门的推理模型,但在解题过程中展现出独特的"啊哈时刻"(顿悟时刻)。在面对"让7米长甘蔗通过2米高1米宽门"这类难题时,模型会自主回溯思考过程,甚至在中英文思维切换中找到突破口,最终给出合理解决方案。

新版模型依然采用671B参数的MoE架构,所有权重文件约688GB,与初代V3保持一致。目前模型已在官网、官方App(需关闭深度思考功能)和HuggingFace等平台开放体验,并继续保持MIT开源协议免费提供。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

DeepSeek V3迎来”小版本升级" 性能直逼V3.5

2025-03-25 15:40:03 浏览量: 2152 作者: 唐薇

3月25日,深度求索公司近日低调推出了DeepSeek V3-0324版本更新。尽管官方将其称为"小版本升级",但实测表现却远超预期,被开发者评价为"堪比V3.5级别"的重大提升。

在开发者Xeophon的个人基准测试中,新版模型在所有指标上均有大幅提升,成为该测试框架下表现最佳的非推理模型。测试显示,该模型不仅能轻松应对4维空间超立方体等复杂数学问题,在编程任务上也展现出惊人实力——仅凭一句提示词就能开发出完整的自适应产品着陆页,性能被认为与Claude 3.7 Sonnet相当。

值得注意的是,虽然DeepSeek-V3-0324并非专门的推理模型,但在解题过程中展现出独特的"啊哈时刻"(顿悟时刻)。在面对"让7米长甘蔗通过2米高1米宽门"这类难题时,模型会自主回溯思考过程,甚至在中英文思维切换中找到突破口,最终给出合理解决方案。

新版模型依然采用671B参数的MoE架构,所有权重文件约688GB,与初代V3保持一致。目前模型已在官网、官方App(需关闭深度思考功能)和HuggingFace等平台开放体验,并继续保持MIT开源协议免费提供。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号