DeepSeek V3迎来”小版本升级" 性能直逼V3.5
3月25日,深度求索公司近日低调推出了DeepSeek V3-0324版本更新。尽管官方将其称为"小版本升级",但实测表现却远超预期,被开发者评价为"堪比V3.5级别"的重大提升。
在开发者Xeophon的个人基准测试中,新版模型在所有指标上均有大幅提升,成为该测试框架下表现最佳的非推理模型。测试显示,该模型不仅能轻松应对4维空间超立方体等复杂数学问题,在编程任务上也展现出惊人实力——仅凭一句提示词就能开发出完整的自适应产品着陆页,性能被认为与Claude 3.7 Sonnet相当。
值得注意的是,虽然DeepSeek-V3-0324并非专门的推理模型,但在解题过程中展现出独特的"啊哈时刻"(顿悟时刻)。在面对"让7米长甘蔗通过2米高1米宽门"这类难题时,模型会自主回溯思考过程,甚至在中英文思维切换中找到突破口,最终给出合理解决方案。
新版模型依然采用671B参数的MoE架构,所有权重文件约688GB,与初代V3保持一致。目前模型已在官网、官方App(需关闭深度思考功能)和HuggingFace等平台开放体验,并继续保持MIT开源协议免费提供。