没想到吧?马斯克也给英伟达打工了
全世界对OpenAI情感最复杂的,非马斯克莫属。积累了10年的恩怨情仇,从蜜月到对簿公堂,马斯克终于下定决心,亲手承担起“干翻OpenAI”的使命。
5月27日,马斯克宣布:其创办的大模型公司“xAI”完成了60亿美元的B轮融资,市场估值达到240亿美元——这已是目前OpenAI约800亿美元估值的三分之一。
能一夜之间为xAI拉满血条,除了马斯克身上的创业光环,还有他自信能稳定地获取英伟达的芯片。
5月,在社交媒体“X”(此前名为Twitter)的路演活动上,马斯克对投资者宣布:xAI目前正在约2万颗英伟达H100芯片上,训练自家大模型Grok 2.0。未来,他要建造一座“计算超级工厂”,用10万颗英伟达H100 GPU芯片,训练Grok 3.0。
在这位全世界最任性,创业也最不计成本的老板支持下,成立虽不满一年,xAI一夜便挺进到了巨头行列,变身为全球AI第二大独角兽。
(5月23日,在巴黎“欧洲科技创新展览会”上,马斯克在视频连线上再次怒怼OpenAI)
虽然马斯克豪言,xAI的使命是为了解宇宙本质:将专注于开发真实的、代表全人类最大利益的AI系统;Grok将具备“严谨、真理与趣味性”,而不是像OpenAI那样只顾着“政治正确”。但在创业路上,马斯克能屡屡涉险而过,就因为他从不是个会单纯“为爱发电”的梦想家,而是有深谙营销的精明。最近,马斯克便表示:xAI将通过包括特斯拉在内的公司销售Grok,而自动驾驶将成为Grok最重要的应用场景。
一切回到在商言商时,味道变得熟悉起来。
但不看好马斯克做AI的也大有人在。5月28日,马斯克在“X”上为xAI高调招兵买马时,遭到了“AI教父”、现任Meta首席AI科学家Yann LeCun(杨立昆)毫不客气的回怼:“如果你能忍受这样的老板,请加入xAI:声称你正在做的事情明年就能解决;声称你研究的东西会杀死所有人;声称要‘最大限度地追求真相’,却在自己的社交平台上散布疯狂的阴谋论。”
而面对马斯克的攻势,OpenAI也迅速拉起防御。5月29日,OpenAI在官网宣布:已开始训练下一代前沿模型,他们会在通往AGI之路上达到更高的能力水平。5月30日,OpenAI又宣布,所有ChatGPT 免费用户现在都可以使用浏览、视觉、数据分析、文件上传和GPTs等原付费功能。这也意味着,对付费用户,ChatGPT仍有后手大招。
▲(图源/网络)
01、靠资金上桌,靠算力点菜
成立于2015年的OpenAI,经过多代模型的迭代,才借助ChatGPT走入了大众视野,融到140亿美元。而马斯克的xAI能一夜之间拿到了OpenAI接近一半的融资,是哪家金主,支撑起了马斯克的宏愿?
据外媒报道,60亿美元的出资者,既包括马斯克的多年盟友,特斯拉和SpaceX的首批投资者Valor Equity Partners,也有实力雄厚的迪拜投资公司Vy Capital——耐人寻味的是,OpenAI的投资方红杉资本、a16z也赫然在列。
这也不难理解。一方面,近日硅谷各方巨头都在投入巨资训练下一代模型,AI的商业化落地也一触即发;另一方面,OpenAI团队“宫斗”频繁,有理由相信,资本方也并不愿看到OpenAI一家独大。
除了到手的60亿美元,马斯克的底气还来自与英伟达的良好关系——在5月英伟达一季报业绩会上,谈及下一代旗舰芯片Blackwell的客户名单时,除了OpenAI、亚马逊、谷歌等大客户,英伟达还特别提到了马斯克的xAI。
▲(2015年,马斯克与黄仁勋在GPU技术会议上)
据The Information报道:马斯克对xAI的投资者表示,融来的大部分资金,将用于租用 AI 芯片。他向投资者暗示:自己是全球少数几位能筹集足够资金、搞到芯片、与顶尖AI公司竞争的人选之一。
马斯克表示,承载起xAI算力的“超级工厂”会由他亲自负责,它由10万颗英伟达H100芯片组成,将于2025年秋季建成。而目前已知的最大规模GPU集群属于Meta,该集群由2.4万颗H100 GPU组成——Meta在训练Llama 3时,使用了两个这样的集群。
不过,即便是强势如马斯克,如今要想从强劲对手的环伺中“抢到”足够算力,压力依然不小。
据“北拓资本”测算,英伟达2024年H系列GPU的出货量,大约在223~266万片,B系列GPU出货量约在 21~29 万片。近期,微软追加下单了12万台服务器,其中包括96万片H100、32万片B200;Meta下单了35万片H100、6.96 万片B200。
上述两家,已经占去了英伟达大半的供应量——这还未将谷歌、亚马逊、甲骨文等厂商的订单量计算进去。
▲(2023年英伟达H100出货量测算,图源/Omdia)
国内一家知名算力供应商负责人对「市界」坦言:“市场到底需要多少算力?这是一个很难预计的数字。目前OpenAI在使用至少6万卡以上的集群,这个数字还会持续增加。不排除有的企业最终会找到模型压缩的方式,可以小集群干大事。”但在此之前,算力的争夺和内卷,仍是大模型发展的前提。
某种程度上,马斯克只能为xAI快速充值,却不能帮它长出肌肉——算力正在限制着Grok的成长速度。
目前Grok1.5能够实现128K tokens的长文本理解和高级推理能力。业界认为,要想短时间内达成如ChatGPT般丝滑的对话效果,在10万块GPU集群上加速训练是必须的。
因此,近日马斯克也亲口承认:Grok与OpenAI和谷歌的竞争,还有很长的路要走。目前,xAI已是甲骨文最大的H100芯片租赁客户,使用了后者1.5万块 H100 芯片。未来,xAI或将继续与甲骨文合作,建造超级计算机。
02、与OpenAI的十年骂战
在拿到60亿融资以前,马斯克还没忘记抓住一切机会,拉踩老对手。5月23日,马斯克在巴黎举行的“VivaTech技术大会”上,再度将矛头指向OpenAI和谷歌,批评他们为了“政治正确”,在生成内容的准确度、真实性上大打折扣。
不过,考虑到马斯克与OpenAI已积累了长达10年的恩怨情仇,他的怒火恐怕不那么单纯。
今年3月1日,美国旧金山法院官网上更新了一份46页的起诉文件,显示马斯克将OpenAI及其现任CEO山姆·奥特曼等人告上了法庭。原因是马斯克认为OpenAI违反了创业时的约定,并列出了包括合同违约、承诺违约、违反信托责任、不公平商业行为、会计审计问题等多条罪状。
沉寂了5天后,OpenAI选择反击,在自家官网上发布了名为《OpenAI与埃隆· 马斯克》的长文,一一驳斥了马斯克的指责,并从自己的角度梳理了双方的恩怨。
令人叹息的是,虽然马斯克现在与OpenAI已成死敌,但最初,他们对AI世界抱有同样的愿景。
2023年出版的《埃隆· 马斯克传》中,这样描述过OpenAI的创办背景:从2012年开始,马斯克逐渐意识到了AI发展的潜在危险,但在寻求合作的过程中数次碰壁。直到他向时任著名孵化器YC总裁山姆·奥特曼谈起想法,两人最终达成了共识。
2015年,OpenAI正式创立,马斯克与奥特曼均担任联席董事长职位。此后,马斯克陆续向OpenAI注资了接近4500万美元,并运用自己的声望和人脉,为OpenAI招揽了大量人才。
但随着马斯克陆续启动了Neuralink、特斯拉自动驾驶等AI项目,双方的共识开始被打破。到2017年底,马斯克产生了将OpenAI与特斯拉整合的想法,并开始谋求对OpenAI的控制权。
这自然遭到了奥特曼和管理层的反对。在2018年2月的一次员工会议上,马斯克宣布辞去在OpenAI的职务,对外则声称特斯拉与OpenAI之间存在利益冲突。同时,马斯克带走了OpenAI的核心人才Andrej Karpathy,任命其为特斯拉自动驾驶首席架构师。
因此,市场一直有猜测,马斯克成立OpenAI的初衷,除了发展开源AI,或许也是为了给特斯拉积累技术,并储备AI行业顶尖人才。
有趣的是,正因为马斯克的离去,OpenAI不得已转投微软,并重新制定了生成式AI的发展方向,才得以因祸得福,一飞冲天。而在分道扬镳之后,马斯克显然没有放弃对AI的兴趣,最终入局,成为了OpenAI的对手。
种种恩怨背后,马斯克与OpenAI双方,也衍生出了一场旷日持久的骂战。马斯克、奥特曼、xAI、ChatGPT等认证账号,常常在社交媒体平台上你来我往、唇枪舌剑。
在xAI融资60亿消息披露之后,马斯克的招聘推文下,Meta首席AI科学家杨立昆也下场拆台评论,两人的互喷在X上引来了3000万人的围观。
▲(图源/网络)
今年3月,马斯克与OpenAI对簿公堂时,便有AI从业者对「市界」指出,不论是骂战还是起诉,马斯克对OpenAI的穷追不舍,都有营销和市场需求。“我和身边的朋友交流,一致认为马斯克的起诉论据并不充分。这个时间点很特殊,正好是在Grok-1.5马上要发布之前。”
03、60亿美元多少是为了特斯拉?
从短期来看,马斯克融到的60亿美元,虽然让xAI上了第一梯队的牌桌;但考虑到马斯克在AI行业内的人望,以及AI创业之激烈,他的这次入局,也远远谈不上众望所归。而xAI被拉起的高昂估值,未来也可能会成为一场“纸面富贵”。
据 The Information报道,微软和OpenAI已经准备好,到2028年时要投入超1000亿美元打造一个数据中心项目,其中包括一台名为“星际之门(Stargate)”的AI超级计算机,配备了数百万个专用服务器芯片,为OpenAI实现AGI提供动力。
这一远景如果成真,AI的创业竞赛,或许会成为只有巨头玩得起的算力军备游戏。而马斯克此刻砸下的60亿美元,也代表了他对于“掉队”的担忧。
从去年11月,xAI推出了首个聊天机器人Grok-1之后,它就一直在巨头后面苦苦追赶。半年多来,xAI陆续发布了Grok1、具备长文本理解能力的Grok-1.5、首款多模态大模型Grok-1.5V,迭代速度已不算慢。
但与ChatGPT每次的惊艳亮相相比,Grok还有不小距离。现在,Grok被外界认同的最大亮点是,训练数据主要来自于马斯克2022年收购的社交媒体平台“X”,因此,Grok也被称为“叛逆”版的ChatGPT,生成式回答更具幽默感。
另一方面,马斯克对大模型的执着,很大程度上离不开与特斯拉的协同考虑。
2022年底,特斯拉自动驾驶部门的工程师曾向马斯克提出建议,可以借鉴ChatGPT,让神经网络通过学习人类驾驶员的训练素材,来实现路径规划。
2023年11月,Grok-1刚刚发布时,马斯克便开始畅想将它接入特斯拉汽车的未来。
他发帖称:“如果我们的车载AI计算机能够运行Grok,特斯拉将可能拥有地球上最多的、真正可用的推理计算机。即便是在出租车上,汽车每周也只需要用1/3的时间规划行驶任务,剩下2/3的时间可用于分布式推理计算。比如 SETI(搜寻地外文明计划)。”
毕竟训练特斯拉的自动驾驶,同样需要数据与算力。此前,特斯拉就被曝出到 2024 年底,投入远超 10 亿美元打造一台「Dojo 项目」的内部超级计算机,用于处理数据和视频。在马斯克眼中,大模型与自动驾驶不如双脚并行。
在Grok的使用场景上,马斯克也将其和X平台嫁接起来,并开始构想它的商业化未来。
2023年12月,结束了早期beta测试的Grok,开始为每月付费16美元的“Premium +”会员提供服务。作为对比,ChatGPT Plus 的订阅价格是每月20 美元。
2024年3月18日,3140亿参数级大模型Grok-1正式对外开源开放。3月底,马斯克表示Grok将向X平台上每月付费8美元的“Premium”会员全面开放;“Premium+ ”用户则会获得Super Grok的疯狂娱乐模式。
另外,此刻马斯克高调下场,或许也有一点要给OpenAI落井下石的因素——毕竟他们正陷入“宫斗”第二季的漩涡当中。
近期,OpenAI超级对齐部门集体离职、不当股权协议等事件频出。5月16日,OpenAI超级对齐(Superalignment)团队负责人、OpenAI联合创始人、首席科学家Ilya Sutskever宣布离职。紧随其后,该团队另一位负责人Jan Leike、OpenAI安全策略研究员Gretchen Krueger也被曝将离职。
2023年7月才成立的“超级对齐”团队,至今还不满一年。该团队旨在确保AI发展符合人类利益,计划未来4年投入20%算力,用“AI监督AI”的方式,保证AI的目标与人类价值观和利益一致。
如今主要成员纷纷离职,据外媒报道,是OpenAI不愿给予团队足够的算力支持。
几乎同一时期,OpenAI被曝要求离职员工签署保密协议,承诺绝不发声批评公司,否则就无法获得薪资包中的股权部分。曝光文件显示,该协议正是由山姆·奥特曼亲自签署。
凡此种种,OpenAI曾经高喊的“OpenAI is nothing without its people”(没有员工,OpenAI便一无是处)的价值观开始出现裂缝;不少员工对其奔赴AGI的信念,或许业已崩盘。相比全力奔赴目标的xAI,用内忧外患来形容OpenAI,并不为过。
而从马斯克可以轻易获得60亿美元融资来看,资本市场也正在寻求OpenAI之外的新的plan B。