英伟达 Blackwell 处理器被曝存在过热 项目或延期
近日,据报道,英伟达备受瞩目的新一代 Blackwell GPU 在高密度服务器机架中出现严重的过热问题。该问题引发了设计调整与项目延期,使谷歌、Meta、微软等主要客户对能否按计划部署 Blackwell GPU 感到担忧。这些 GPU 专为 AI 和高性能计算(HPC)设计,但在单个服务器机架配置 72 个处理器的情况下,功耗可高达 120 千瓦,随之而来的散热挑战也日益突出。
知情人士透露,英伟达 Blackwell 处理器的过热问题迫使公司多次修改机架设计,为应对高功耗和散热压力,不得不限制部分 GPU 性能,以降低硬件损坏风险。这一技术难题影响了客户对产品的部署计划,包括谷歌、Meta 和微软等科技巨头,他们高度依赖英伟达 GPU 训练其最强大的 AI 模型。项目延期可能会对这些客户的研发进程与产品发布节奏带来不小的影响。
面对过热挑战,英伟达已要求供应商调整机架设计,优化散热系统。据悉,英伟达与云服务提供商密切合作,通过工程调整希望缓解散热瓶颈,确保产品性能和可靠性。英伟达发言人在接受路透社采访时称,这些设计改进属正常研发流程的一部分,公司正在加紧应对技术挑战,以便按预期满足客户需求。
据报道,修订后的 Blackwell GPU 于今年 10 月底才进入量产,预计最快将于明年 1 月底出货。尽管英伟达曾在今年 3 月展示 Blackwell 芯片,并计划在第二季度发货,但实际发货时间显然已被推迟。对于谷歌、Meta、微软等依赖 Blackwell GPU 的科技巨头来说,这一延期无疑对其 AI 研发和高性能计算部署计划产生了不可忽视的影响。