微软悄然开发网卡替代品 想要彻底摆脱对英伟达
腾讯科技讯 2月21日消息,近几年来,特别是AIGC的浪潮兴起,英伟达的AI芯片一直供不应求,成为所有AI相关高新科技企业都在争夺的香饽饽。知情人士周二透露,为摆脱对英伟达的过度依赖,微软继去年公布AI芯片后,正在开发一款英伟达网卡的替代品,类似于英伟达的网卡ConnectX-7,用它确保数据在微软的服务器之间快速移动。
据悉,微软开发这款新网络设备的目的除了可能为其节省资金外,该公司还希望它能够提高其搭载英伟达芯片服务器的性能。微软决定自主开发网卡之际,正值英伟达人工智能芯片的需求激增,引发了市场对关于这种激增将持续多久,以及在竞争对手人工智能芯片上市和大型科技公司采取措施减少对英伟达依赖的综合影响下,英伟达的实力是否会受到削弱的激烈辩论。
尽管微软是英伟达GPU的最大客户之一,但该公司一直在采取措施减少对英伟达的依赖。微软开发了自己的Maia AI服务器芯片,今年将开始安装在自有数据中心。微软正在开发的新网卡也可以提高Maia芯片的性能。
市场调研公司Dell’oro Group负责数据中心基础设施的巴伦·冯(Baron Fung)表示,微软和其他云提供商“不想受制于英伟达生态系统”。知情人士透露,微软首席执行官萨提亚·纳德拉(Satya Nadella)已任命曾联合创立网络设备开发商Juniper Networks的帕拉德普·辛杜(Pradeep Sindhu)领导网卡开发工作。微软去年收购了辛杜创办的服务器芯片初创公司Fungible,他和他的团队由此加盟微软。
截至目前,辛杜本人及英伟达均对此报道未予置评。微软发言人在声明中表示:“作为我们对Azure基础设施系统方法的一部分,我们专注于优化堆栈的每一层。我们定期开发新技术来满足客户的需求,包括网络芯片。”
与微软在云计算领域展开竞争的亚马逊AWS和谷歌,也因为类似原因开发自有人工智能芯片和服务器网络设备。巴伦·冯表示,在这些公司目前都依赖于英伟达GPU的同时,它们希望自己的数据中心能够使用各种人工智能芯片。微软的网络组件可能会侵蚀英伟达服务器网络设备的销售。英伟达之前表示,该业务每年有望产生超过100亿美元的营收。英伟达将于周三盘后公布2023财年业绩,营收有望达到588亿美元。
网卡是数据中心的一项重要技术,主要用于加快服务器之间的流量。当微软在自有数据中心使用英伟达制造的人工智能芯片时,服务器可能会过载,因为它们需要移动开发人工智能的客户(如OpenAI)所需的大量数据。微软自主开发的网卡的推出,可能对该公司大力投资的OpenAI有帮助,减少OpenAI用微软服务器训练AI大模型的时间。OpenAI首席执行官山姆·奥特曼(Sam Altman)曾私下表达过对微软算力相比谷歌逊色的担忧。
知情人士透露,OpenAI的高管团队私下讨论了他们在英伟达服务器上遇到的问题,并与微软就新网卡可能会有所帮助进行过讨论。新网卡可能会缩短OpenAI训练模型所需的时间,并降低训练过程的成本。“在大型AI网络中,解决延迟问题至关重要,”巴伦·冯说。“没人希望流量传输瓶颈造成延误。”
奥特曼忍无可忍
奥特曼一直非常担心他的公司未来开发和运营人工智能的服务器容量,因此他讨论为一家新芯片企业筹集万亿美元的资金。该项目每年将产生至少数千万颗GPU,比英伟达目前的产量多出很多倍。
微软开发的新网卡不同于该公司推出的另一款服务器硬件Azure Boost,后者可以从服务器上卸载额外的算力负载,释放空间并提高性能。AWS早些时候推出了类似的技术Nitro。与此同时,AWS投资了其他类型的自有服务器网络技术,包括一种类似于英伟达销售的InfiniBand系统。AWS计算和网络副总裁戴夫·布朗(Dave Brown)去年曾表示,AWS在数据中心使用专有网络硬件连接GPU服务器,提高了它们的性能。
在微软和其他云提供商试图减少对英伟达依赖的同时,英伟达正在采取措施对抗这些举措。该公司一直在搭建自己的云服务,在大型云公司的数据中心内运行。这项名为“DGX云”的服务允许英伟达在某些情况下决定服务器的配置,甚至包括它们使用的网络设备类型。