英伟达新AI芯片推迟至少3个月 微软等巨头将受影响
据国外媒体报道,英伟达最新的人工智能芯片项目遭遇设计缺陷,据两位参与芯片及服务器硬件生产的消息人士透露,这一意外将导致发布时间延后至少三个月,甚至更长时间。
这一变动预计将对包括Meta、谷歌及微软在内的多家大客户造成影响,这些客户已预订了价值高达数百亿美元的该系列芯片。
据微软内部员工及另一名知情人士证实,英伟达已在本周向其最大客户之一微软及另一家主要云服务提供商通报,其Blackwell系列中最为尖端的人工智能芯片将延期交付。
英伟达于今年3月正式推出了Blackwell系列,首席执行官黄仁勋在5月份曾乐观地宣布,计划于年内实现该系列芯片的大规模出货。然而,这一进程在遭遇设计难题后遭遇挫折。据直接参与Blackwell芯片生产的知情人透露,英伟达正携手其芯片制造商台积电,紧锣密鼓地进行新一轮的测试生产,以克服当前的技术障碍。
鉴于此,预计Blackwell芯片的大规模出货将推迟至明年第一季度。值得注意的是,一旦云服务提供商收到芯片,还需额外约三个月的时间来部署并激活大型芯片集群。
设计与生产上的挑战加剧了市场对英伟达处境的担忧,尤其是在美国司法部正对其涉嫌反竞争行为的投诉展开调查的背景下。尽管如此,英伟达凭借其芯片在性能上的显著优势,依然稳坐行业领先地位。
股东们对Blackwell系列寄予厚望,Keybanc Capital Markets的分析师预测,该系列芯片有望推动英伟达数据中心收入从2024年的475亿美元跃升至2025年的2000亿美元以上。黄仁勋在5月的财报电话会议上曾表示:“我们今年将见证Blackwell带来丰厚收入!”
英伟达的人工智能服务器芯片——图形处理单元(GPU),长期以来都是OpenAI等开发商在对话与视频人工智能领域的核心驱动力。同时,这些GPU助力微软等云服务巨头,通过向其他开发者出租芯片资源,实现了销售额的显著增长。
若即将面世的人工智能芯片B100、B200及GB200遭遇至少三个月的延期,或将打乱部分客户的部署计划,导致他们无法在2025年第一季度如期在数据中心内运行大型芯片集群。
微软、OpenAI及Meta等重量级客户正翘首以盼英伟达的新芯片,旨在利用这些技术升级开发下一代大语言模型,也就是ChatGPT、Meta AI助手及一系列创新自动化功能背后的核心软件。
这些公司强调,要实现软件性能的飞跃性突破,以更精准地回应复杂查询、自动化执行多步骤任务或生成高度逼真的视频内容,亟需更强大的计算能力。他们寄予厚望于英伟达的下一代人工智能芯片,尤其是当这些芯片被整合为超级计算机集群时,所能带来的性能飞跃。
英伟达发言人对于延迟发货的相关声明保持谨慎,仅透露今年晚些时候“生产进度将按既定计划加速”。
微软、谷歌、亚马逊及Meta的官方代表均选择不对此发表评论。台积电发言人则未回应置评请求。
值得注意的是,英伟达的主要客户对GB200芯片寄予厚望,并已有宏大规划。近期,谷歌、Meta与微软纷纷揭示了其在数据中心及人工智能芯片领域的巨额投资增长,这一罕见举措不仅暂时推高了英伟达股价,也引发了市场对这些企业投资回报周期及盈利前景的广泛讨论。
Blackwell大单
据两位芯片生产领域的消息人士透露,谷歌已预订超过40万颗GB200芯片,连同相关服务器硬件,其订单总价或远超100亿美元,但具体交付时间尚不明朗。相比之下,谷歌本年度在芯片、设备及资产上的投入已攀升至约500亿美元,同比增幅超过50%。
同时,Meta亦有大手笔动作,其订单总额预计不低于100亿美元。微软方面,虽未透露总订单规模,但近几周已对订单进行了20%的增量调整。据直接知情人士透露,微软正筹备在2025年第一季度前,为OpenAI配置5.5万至6.5万颗GB200芯片。
一位知情人士表示,微软原本计划在明年1月前向OpenAI交付基于Blackwell的服务器,但现可能需调整至3月或早春时段。
参与Blackwell芯片制造过程的两名内部人士透露,该芯片的设计难题于近几周浮现,台积电工程师在筹备大规模生产阶段发现了关键缺陷。具体而言,问题集中在连接双Blackwell GPU的处理器芯片上,这一硅片组件的故障直接影响了整体产量,即台积电向英伟达供应的芯片数量受限。此类问题往往促使企业暂停生产活动。
鉴于此,英伟达正紧急调整设计方案,并需在台积电重新进行生产测试,以确保问题得以解决后再启动大规模生产流程。
据知情人士透露,英伟达已向至少一家云服务提供商透露,为应对当前困境并加速产品交付,该公司正考虑推出仅搭载单一Blackwell芯片的版本作为替代方案。
不同寻常的延迟
台积电原计划于第三季度启动Blackwell芯片的大规模生产,并预期从第四季度开始向英伟达客户批量发货。然而,现预计Blackwell芯片的批量生产将推迟至第四季度,若后续没有新的问题,服务器将在随后几个季度实现大量出货。
芯片生产延期并不罕见。据知情人士透露,英伟达在2020年旗舰GPU的早期版本也曾遭遇延迟,但当时其市场影响力还较低,客户对订单的期待亦不高,因此对数据中心及芯片投资收入的即时影响有限。
不过,此番在即将大规模生产之际发现重大设计缺陷,实属不同寻常。通常情况下,芯片设计团队会与台积电等制造商紧密合作,历经多轮生产测试与模拟,确保产品成熟可靠后再接受大批量订单。
据台积电内部员工透露,作为全球领先的芯片制造商,台积电罕见地暂停了生产线,对这款即将量产的产品进行重新设计。鉴于GB200芯片的大规模生产计划,台积电已预先调配了生产资源,但在问题未解决前,这些资源将处于闲置状态。
此外,该设计缺陷还波及了英伟达NVLink服务器机架的生产与交付进度,因为相关公司需等待新的芯片样品以完成机架设计。