英伟达GTC 2024: 绝对霸主的权力与遥远的野心
1: 英伟达GTC 2024
英伟达,2024财年四季度营收是前一年同期水平的3.5倍。
利润是前一年同期水平的9倍。
股价在16个月内上涨了6倍。
AI浪潮给予英伟达的荣耀让这家公司坐上了全球市值第三的位置,也吸引了上万人来到英伟达在美国时间3月18日到21日举办的2024年度GTC大会现场,包括作为受邀媒体参会的我们硅谷101。
我们在参会前非常好奇,已经成为AI芯片霸主的英伟达在接下来面对AMD、英特尔以及Groq等众多竞争对手的追击,以及英伟达的大客户们,包括谷歌、Meta、亚马逊等等科技巨头都正在自研芯片的压力下,它如何向市场传达出,英伟达能守住霸主地位并且这个市场在未来还有巨大增长潜力的信号,来继续激励华尔街和硅谷。
我们经过四天的参会、逛展会、听论坛和分析师采访,带大家云参会2024年英伟达GTC,也顺便聊聊,作为AI芯片市场绝对霸主的英伟达想要传达出的野心和布局。
在今年英伟达GTC大会中,有四大板块和议程是我们非常关注的,分别是:
1)英伟达创始人和CEO黄仁勋在第一天的重磅演讲keynote中将传达出的信号;
第三天议程中,黄仁勋会主持一场座谈panel,邀请了当今生成式AI浪潮的奠基石论文Transformer架构的Attention Is All You Need论文8位作者到场,这8位作者当年都在谷歌,但后来都纷纷出来自己创业,所以这会是第一次他们8人再聚在一起讨论AI的未来,非常是历史性一刻;
3)前来参展的各家英伟达合作公司,因为这显示出英伟达的业务前景,以及软硬件落地的实际效果我们能有一个很直观的感受;
4)就是分别在这四天中英伟达请来的演讲和论坛嘉宾,从各个科技巨头和AI独角兽的科技领袖分享中,大家对AI行业传递出的信号。
接下来,我们就结合以上四点来聊聊我们对这次GTC的观察。
2: 芯片架构更新Blackwell
黄仁勋的整场演讲从下午1点到3点,持续两个小时,其中涵盖了英伟达的硬件和软件的各类产品更新,现场PPT和视频效果非常震撼。
老黄非常善于演讲,没有请任何的嘉宾,就一个人在台上讲了两个小时,很会控场也有幽默,台下的效果和观众反应都很热烈,特别是最后讲到英伟达机器人业务那一块,老黄把迪士尼正在研发的Wall-E小机器人请到台上互动,开了些小玩笑,简直太可爱了,效果非常好。
整体来说,除了有几个段子没响之外,气氛都拉到了顶点,很多人看了keynote出来之后都直呼兴奋。
这场万众聚焦的GTC演讲的重点之一就是:重磅GPU架构更新,所以黄仁勋把很大一部分演讲重点放在了名为Blackwell的下一代GPU 架构。
他告诉台下观众们:“如今AI训练需要更大的算力,那么就需要研发出更大的AI芯片来支持训练”。
(我们很快会上线一个和业内人士一起逐帧讲解这个动画的视频,详细讲讲每一步,英伟达在Blackwell系列芯片硬件更新上做了哪些设计优化,以及接下来对AI芯片产业将带来如何的影响。)
总的来说,新的架构下,Blackwell系列包括三个型号:B100、B200 和Grace-Blackwell Superchip(GB200)将是下一代更强大的芯片性能更新,也继续实现着黄仁勋之前制定的黄氏定律Huang’s Law – 也就是,GPU将推动AI性能实现逐年翻倍。
黄仁勋,NVIDIA创始人兼首席执行官:
如果要训练一个1.8万亿参数GPT模型,大约需要三到五个月的时间:如果使用传统的安培芯片,大约需要25000个。如果用Hopper来做,可能需要8000个GPU,并且会消耗15兆瓦。8000个GPU和15兆瓦,它会需要90天,大约三个月的时间。如果你用Blackwell来做,只需要2000个GPU。2000个GPU,同样的90天。但这是惊人的部分,只需要4兆瓦的电力。
这里还有几个值得注意的点:对于新一代的B100、B200 和 GB200,这些芯片的工作功率范围在700W到1200W之间。随着新一代芯片的功率和性能都大幅度升级,在AI数据中心领域,想要发挥Blackwell的最大潜力,转向液态冷却几乎成为必须,这也给超微电脑Super Micro等数据中心硬件供应商提出了新的挑战。
陈茜,硅谷101联合创始人:
新出来的B200他可能算力更大、耗能更大对吧?装载的rack跟现在来比是不是技术上面、设计上面需要更大的更多的一些提升?
Chiawei Chen博士,Senior Director, Super Micro Computer:
基本上以现在我们都按热设计功耗(TDP),它以GPU来讲是越来越高,像比如说现在的H100大概一颗大概700瓦,那B200已经到一颗到1千瓦,所以水冷这件事情已经不是可以有,是必须有。对,我们必须要做这件事情。那因为算力需求越来越高,你用ChatGPT,那就算力需求越来越高,但是它又是一个比较high power consumption(高耗能)的东西,所以你必须要有一个很有效率的Thermal(散热)的解决方法,去把算力保持住或者甚至提高。但是你去low down去降低所有环境,或者是说空调设备的使用电量,那大概就是水冷。
另外,芯片的产能问题也一直是困扰英伟达的一个方面,因为虽然发布了B200,但是市面上能配置到H200的公司都不多。在这次大会上,英伟达也试图直面这个问题,包括台积电TSMC 和Synopsys将 NVIDIA合作,将在生产中使用 NVIDIA 计算光刻平台,希望在加速芯片制造速度的同时,也加快了对未来最新一代NVIDIA Blackwell架构GPU的支持。
3: 华尔街“暂不接招”
整体来说,黄仁勋的keynote期间在硬件上的发布效果还是非常好的,但是,从GTC这几天的股价震荡就可以看出来,华尔街并不觉得惊喜,因为之前在2月公布财报的时候,利好都已经出尽了,市场已经知道英伟达会出新的芯片,这些硬件的更新已经被市场提前消化了。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (济容投资):
新发布的这个硬件的产品来看的话,其实我觉得没有什么特别大的意外。因为其实目前供应链的这些渠道检查,大家做得确实也都比较细致,比较到位了。我觉得就是硬件,如果让我来总结我的感受的话,我觉得是“预期之内的好”。我觉得可能是比较客观的一个评价了。
陈茜,硅谷101联合创始人:
你们会觉得说这个新的硬件的发布会,对整个英伟达在AI芯片中的地位造成任何的影响吗?会进一步的去巩固它的现状?还是会跟其他的,例如MI300等其他的一些竞争对手其实拉得更远?
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (济容投资):
我觉得其实现在这是一个大家交替领先,同时在进步的这么一个状态。因为可能放在几个月之前,MI300刚刚出来的时候,大家会觉得MI300在硬件层面上,其实在已经一定程度上超越了H100。 然后当时大家对AMD的预期就拔得很高,认为MI300可以很快地占据市场。但是我觉得这种角度去看可能是过于静态了,因为没有一家公司他真的就会止步不前,然后不再进步。包括像Jensen英伟达,他们是已经对于MI300的这些进步吧,他们是完全是看在眼里,也是有预期。他们自己在B100里面也是了加入了很多:比如像内存一致性、比如将更大的高带宽内存,这些东西加入到B100里面,其实是大家共同进步,交替领先的一个状态。所以我觉得整体来看,我觉得硬件上英伟达确实还是走得很稳,还是在全速地往前推的这么一个状态。他跟其他的竞争对的是持续性地一个差距,没有再缩短的状态。
所以,在这次GTC上,硬件的发布更新固然重要,但我们能强烈感觉到,黄仁勋想要强调的是,英伟达不仅仅是一家GPU公司,英伟达想要通过软件的升级,不仅仅是已经成功变成英伟达牢固护城河的CUDA,还有更远的布局。
黄仁勋在他的keynote中强调的很清楚,他眼中的新一代市值100万亿美元的新工业革命市场,英伟达是这样布局的:除了Blackwell硬件算力平台,黄仁勋还着重推出NIMs,帮助企业级客户接入AI。
NVIDIA NIM是经过优化的推理微服务,用于大规模部署 AI 模型,为开发AI驱动的企业应用程序和在生产中部署AI模型提供了比较便捷和简化的路径。也就是说,企业想要部署AI,英伟达在生态上已经给你提供了各种api和基础大模型,让企业更快的上手。
此外的生态重点是英伟达的AI foundry和NeMo。去年英伟达发布的AI foundry 具备三个要素:英伟达的AI基础模型,NVIDIA NeMo 框架和工具、用于构建、自定义和部署生成式AI 模型,以及NVIDIA DGX 云AI 超级计算服务。这样依赖,AI foundry就可以用于为企业软件、电信、媒体等各个行业的生成式AI 应用定制模型。而在今年,英伟达进一步在这样的AI foundry生态上继续更新各种基础模型和生态服务。
下一个重点就是英伟达的Omniverse,也就是物理模拟反馈的平台,通过模拟与物理世界中各种互动的过程,来训练AI。我们在之前讲机器人那一集的时候就着重提过,AI机器人在模拟环境中的训练非常重要,而现在来看,不仅仅是AI机器人,还有无人驾驶,气候模拟,药物发现,计算生物学,乃至于Vision Pro所构建的XR生态,英伟达的Omniverse都已经在布局。
这次GTC上,英伟达宣布了Omniverse Cloud API接口,让开发者能够轻松地将Omniverse的核心技术直接集成到现有的数字孪生设计与自动化软件应用中,或是集成到用于测试和验证机器人或自动驾驶汽车等自主机器的仿真工作流中。
同时在keynote中,黄仁勋进一步强调Isaac Sim,这个基于Omniverse平台之上的机器人培训与模拟系统,这相当于给机器人构建了一个全新的“操作系统”,同时,英伟达还宣布了一个名为GROOT的机器人通用基础大模型,和新型计算机Jetson Thor来加速机器人训练。
而且,黄仁勋的一对儿女都在Omniver部门就职,女儿Madison Huang是Omniverse部门的高级产品营销经理,儿子Spencer Huang是Omniverse旗下机器人仿真和扩展组的产品经理,可见老黄对这个Omniverse这项业务的重视程度。
而从英伟达邀请的这四天的分享嘉宾中,我们能从现场就感受到,公司在软件生态上的布局和发力。在各个panel和分享会上,我们也很直观的感受到英伟达软件生态的升级,给各个行业带来的助力,这包括大语言模型赋能自动驾驶技术上,英伟达的数字孪生digital twin的模拟技术能让自动驾驶继续在模拟器中得以更好更快更有效率的训练。
另外,在具身智能专家李飞飞和波士顿动力机器人的分享环节中,嘉宾也都强调了深度机器学习给机器人技术带来的巨大潜力,包括在模拟环境中的训练,以及在周一,黄仁勋也宣布了一个通用人形机器人基础模型的新平台,来和波士顿动力等等机器人公司合作,加速机器人的发展。
然而,虽然我身边一些做软件和研究的科学家和博士朋友们都对Omniverse以及digital twin数字孪生的升级有很大的期待,但无论是从昨天黄仁勋的演讲现场,还是今天的分享会上,我们的感受和观察是,软件上的升级似乎并没有给外界带来非常大的兴奋值,包括在昨天的keynote演讲中,特别在软件环节,黄仁勋好几个讲的笑话和梗现场的观众都没有get到,好几度比较冷场。
陈茜,硅谷101联合创始人:
有几个朋友他们是读PhD技术背景出来的。他们会觉得说特别是软件方向,包括数字孪生,包括模拟方面,英伟达在软件方向提供这么多的支持,整个的研究、调研、他们的工作会加快非常多,所以他们感觉非常的兴奋。但是感觉就是讲硬件的那一块,当然很燃,大家就是能够很快地理解到他硬件提升多少倍。但是好像讲了软件的那一块,我感觉到现场好像参会者不是那么容易的能get到,英伟达他想要去做什么事情,他想的是一个什么样的市场。我觉得说老黄他表达出来的东西,跟现场观众接受到的信息中间还是有一个不对等。
Yang Ren,Senior Analyst&Partner at Jirong Investment Management (济容投资):
对,我特别同意你这个观察。我觉得英伟达,大家对于它的芯片这一块其实已经认知得非常充分了,软件这部分我觉得可能不光是听众或者说投资人,有时候我甚至有一个感觉,就是英伟达自己对于他们的软件这一块到底是什么样一个战略,或者什么样一个策略,也还是没有一个特别清晰或者说完全成型的一个状态,都是在走一步、看一步,然后逐渐慢慢摸索的这种状态。你刚才提到一点,就是说觉得中间好像还隔着点什么?我也是这么一种感受。包括这次,大家都听到他提很多关于数字孪生、关于Ominverse的这些东西。但是这前两年他第一次把Omniverse这个东西拿出来讲的时候,大家都非常困惑,不知道Jensen到底想把这个东西来干嘛用?怎么去卖?一开始的时候,大家只是感觉这就是一个,对于这些3D设计师或者说平面设计师用来协作的一个平台。但是随着现在慢慢的发展,慢慢地变成了数字孪生的一个操作系统。同时这些数字孪生在工业里面最初始的应用,跟现在比较类似。我记得他最早提到在宝马工厂里面一个应用,就是帮助在工厂建设的过程中,提前做好布局设计,做好工作流程的这些安排,这样的话可以提升整体运行的效率。因为这次提到了包括Wistron公司的例子、包括西门子的例子,都是类似的一个概念,我觉得非常合理。
一定程度上就是,在这些工业制造领域里面虚拟实境的一个应用。另外他提到Omniverse的一个应用,就是机器人的训练场。我觉得这个也是他们一直在做的事情,之前也断断续续有提到过。但之前整个软件的版图,给我的感觉就是他们这有一点东西,那有一点东西,但是一直缺一个特别好的、特别有凝聚力的一个战略,能够把所有的拼图拼在一起。这一次听完我其实真的有这种感觉了,就是有一种AI和Omniverse汇聚这么一种感觉。我现在能慢慢能够看到他们软件这一块更清晰的一个版图、一个战略往后走是什么样的。我能理解,为什么你刚才提到很多比较关注软件的朋友,他们会觉得非常兴奋。
陈茜,硅谷101联合创始人:
Bruce,你觉得对于就是华尔街来说,看到它软件上面的一些业务慢慢的清晰化了,以及AI跟软件的一个结合,这会对它的估值来说,会有一个更高的提升吗?
Qindong Liu,Portfolio Manager&Partner at Jirong Investment Management (济容投资):
我觉得其实是这样子,就是我们管叫rerating(重新评定)的这么一个过程。那我觉得现在大部分,你从它现在估值水平,我觉得市场其实还是把它当成一个芯片公司。我觉得这个是落后于英伟达自己的想法的。英伟达慢慢把自己定位成一个系统公司,不但是有硬件、软件,我又能帮助你打造整个生态,就给你提供一个大的生态。譬如说我们之前还在讲,说起来这相关又不那么相关:就说以后无人驾驶这一块,特斯拉大家都知道了,我不知道有多少人真的会想到说,英伟达在这里面以后也会成为特别重要的一环。像我前两天和任总还在讨论,以后是不是除了特斯拉之外的这些原始设备制造商,都要给英伟达去打工了。就是当市场逐渐意识到这是需要时间的。像Jensen这样这么一个有远见的CEO,在接下来的几年,只要是AI这个赛道不冷,只要能一直这么发展下去,他会逐渐地把这些东西灌输给市场,然后逐渐地被大家接受。
华尔街总是难以讨好的,硬件升级,华尔街并不惊喜,因为之前报财报的时候已经被市场消化了,而软件布局,华尔街没有看到即刻的营收价值,目前也没有买账。但这并不影响黄仁勋的长期主义和未来布局,毕竟,加速计算他布局了20年,CUDA软件布局了10多年。
4: 权力与野心
无论华尔街是否在现在买账,黄仁勋管理下的英伟达正在动用一切的努力去加固自己的护城河,也毫不掩饰的展示出未来朝着更多领域提供服务的野心。
最近一个黄仁勋在斯坦福的演讲中,他说:他的目标是就算竞争对手的芯片免费送,也不如英伟达的划算。非常大的口气。
黄仁勋,NVIDIA创始人兼首席执行官:
我们部署的时间、我们的表现、我们的落地应用,以及在不同应用间的灵活性,这些综合起来,容许我们的运营成本,我们的总体运营成本好到一个程度。就是即便竞争对手的芯片免费送,也无法便宜过我们。这就是我们的目标:让成本不再成为我们产品价值的衡量标准。当然这个需要我们付出很多心血,得持续创新、虚心前行。但我们的竞争对手太多了
所以,更高的护城河,更大的生态系统,是黄仁勋追求的。
一篇华尔街日报里面写到的细节,说风险投资公司Thomvest Ventures的董事总经理Umesh Padval说他和黄仁勋一起去投资布局一些初创公司的时候,黄仁勋毫不掩饰并且以来就比较aggressively、比较激进的直接问,“我需要做什么才能建立生态系统,以便我可以销售更多的芯片和系统?”
所以,我们看到,目前英伟达参与了很多的初创公司投资,除了上面说的这家Thomvest和英伟达一起投资的基础模型AI公司Cohere之外,英伟达还投资了云计算公司CoreWeave。华尔街日报报道, 在上一财年中,英伟达所持其他公司的股份价值增长了五倍多,截至2024年1月底达到约 15.5 亿美元。而英伟达在 2023 年总共投资了超过35家初创公司,这个投资量级是上一年的三倍多。
所以,在这些人工智能、机器人、自动化、医疗保健公司等等赛道,黄仁勋都在布局。也许这些赛道还没有爆发,也许还需要很长的时间,但就像黄仁勋20年前就开始布局加速计算、10多年前就开始布局CUDA一样,这些产业被老黄称为“Zero-billion dollar markets”,就是目前市场有限、但在未来可能会爆发的市场,黄仁勋在一如既往的提前布局他遥远的野心。
而黄仁勋在目前是有资本进行布局的:股价一路上涨、手握大量现金不说,另外一个原因我们在跟硅谷一个VC聊天的时候对方说:现在VC去抢好项目,明星AI公司看的不是你给的估值有多好,而是看你有没有买GPU的渠道。而这个渠道的权力,有谁抢得过英伟达本身呢?
所以,英伟达如今抢占各个明星AI项目的席位,也是非常顺理成章。而这样的市场绝对霸主地位带来的权力让英伟达有着很大的话语权。
华尔街日报同样的一篇文章中写到:甲骨文创始人兼董事长Larry Ellison在去年9月的一次公司会议上讲述了他和马斯克与黄仁勋在硅谷Palo Alto的Nobu日本餐厅吃晚餐。Larry Ellison回忆说,描述这顿饭最贴切的方式是:一个小时的寿司和乞讨。
原文真的用的乞讨(begging)这个词。所以,我们用了“绝对霸主的权力”和“遥远的野心”作为视频的主题,我觉得还挺能概括目前英伟达的状态的。
但是并不是说英伟达就没有挑战了。英伟达可能面对的最大威胁,正是自己。
如果生成式AI像自动驾驶一样发展到瓶颈期,或者最终证明transformer这个架构并不是将人类带向AGI,那么英伟达将面临非常大的危机。
可能这也是为什么黄仁勋将本次GTC大会上,将Transformer论文作者聚集在一起的原因之一。
5: Transformer七子:AI的未来
最后,再来说说本次GTC大会上的一个大热门环节:由黄仁勋亲自主持,邀请了Transformer这篇论文的几位作者到场。
2017年,8位谷歌的研究员发表了一篇论文叫做Attention is all you need,这篇论文提出了一种新的简单网络架构,这就是Transformer,它完全基于Attention注意力机制,完全摒弃了之前的RNN和卷积CNN等机制。
而正是因为这篇论文,刚成立的OpenAI开始用transformer的架构开始训练GPT路线,开始走堆算力和堆参数的AI训练方法,之后才造就了今天我们所看到的生成式AI革命。所以这8位研究员可以称为如今生成式AI的大功臣,而他们在意识到transformer架构的潜力之后,也相继的离开了谷歌,开始投身于不同的初创公司和项目当中。
这里面其实有两个很有意思的点:
1)Transformer架构是谷歌最先推出的,但这几位研究元老一位都没有留住,他们在分享中也说道,因为方法有了,接下来最重要的就是快速的出应用,接触用户,完善产品,寻求市场反馈,然后再快速的推进,但显然,谷歌陷入的所谓的“大公司创新陷阱”里,很难在公司内部来快速推进,所以大家只能纷纷叛逃,出来自己做初创公司,这8位从前的研究员,如今的创业者,全部都是这样。
2)他们也看到了如今AI浪潮所带来的机会,而他们本身的光环就足够能吸引融资和人才人脉加入他们。在硅谷,人们都想创业,都想自己推出产品,主导创新,而就像黄仁勋说的,接下来10年将是黄金10年的机会,所以也难怪8位研究员都出来自己单干。很有意思的是,他们之前从来都没有聚在一起过,之前都是线上合作办公,而这一次,除了一位女性研究员Niki Parmar 因为有家里急事没有来之外,其它七位研究员都来到了现场,可以说是非常有历史纪念意义的一个瞬间了。
整个会场从很早就开始排队,差不多接近2000人的会场都坐满了,黄仁勋也提前来到现场和大家打招呼合影,之后介绍每位研究员上场。
他们分别是AI角色扮演对话公司Character AI联合创始人兼首席执行官Noam Shazeer;
我们上面提到的基础模型AI创业公司,Cohere联合创始人兼首席执行官Aidan Gomez;
Ashish Vaswani和缺席的Niki Parmar 两人联合创立了Essential AI这家基于大模型的全栈型智能产品开发商,Essential AI开发了一项名为“企业大脑”的技术,可以利用AI执行企业职能,比如说数据分析,并自动执行单调的任务。
此外,Llion Jones在日本东京创建了Sakana AI,这是一家AI技术研发商,专注于为基础模型创建新架构;
Illia Polosukhin联合创立的使用区块链为AI 赋能的Near Protocol公司;
此外,Jakob Uskhoreit是Inceptive的联合创始人兼首席执行官,这家公司将人工智能用于mRNA疫苗开发;
同时英伟达也投资了他们;最后是Lukasz Kaiser,加入了OpenAI,而黄仁勋介绍他上台时开玩笑说,这是8位作者中唯一一位还在做工程师的技术人员。
而在座谈会上,大家分享了自己从事的公司方向,以及对技术的理解。大家认为,模型还需要进一步的优化,无论是在技术还是在推理上,我们还需要看到技术的继续突破,甚至需要有比transformer更好的框架。
Aidan Gomez,Cohere联合创始人兼首席执行官:
我仍然觉得,我们与最初的设计形态相似过高。这让我有些不安。我认为世界需要一种比transformer更先进的模型。我们所有人都希望它能被更高效的技术所取代。将性能继续往上拔高。
而一个比transformer更好的模型或者框架,英伟达的GPU是否还是必不可少的呢?这其实是一个问号,也是英伟达最大的危机所在。
但无论如何,目前算力是紧缺的,七位作者也一致认为,接下来,自适应计算(adaptive computation),也就是如何在特定的问题上分配合适的计算量,也是接下来的着力点之一。
换句话说,如果我们把2+2=4这个问题输入现有模型,计算机需要使用一万亿参数解答这个问题,而这个问题的价值就不如问“2+2为什么等于4”,所以之后我们如何去集中算力解决更有价值的问题、更合理分配算力,也是接下来需要推动的方向。
同时,七位作者也认为,AI下一个更重要的方向是训练AI的推理和自主决策能力,因为AI的推理能力越强,所需要的数据训练量就越少,届时用于训练的数据质量会更加重要,人机交互会更加深度,而接下来 如何去训练更高质量的数据、私人的数据,将是接下来发展的重点和挑战。
而随着AI技术迅速往前更迭,创业者以及创业赛道都面临着巨大的不确定性。所以今年2024年GTC给我的唯一确定性就是,AI还是继续发展和变化。
最后,问大家一个问题,大家知道GTC的全称是什么吗?
公布答案:GTC大会的全称是“GPU Technology Conference”。
第一届是2009年,此前都是非常GPU非常硬件的会议,但之后随着英伟达公布CUDA,公布软件布局,如今,GTC已经不止是GPU,而是更大的生态,以及将会影响人类未来的各种可能性。