看完老黄演讲,地球上已经没有人可以阻止英伟达了
英伟达牛X。
很多人把英伟达比作AI时代的「卖铲人」。根据彭博社预测,2024年,英伟达在AI GPU领域的销售额将达到惊人的400亿美元。
要知道,英伟达2024财年的总营收,是609亿美元。
如此强势的业绩,也让英伟达凭一己之力,撑起了整个美股大盘。
但看完了黄仁勋的最新演讲,我觉得英伟达不止是一个AI时代的「卖铲人」,更是一个“未来世界”的「工程师」。
这个未来世界,就是以加速计算为基础的人工智能大爆炸的世界。
加速计算时代
这是一张男人的脸,细节到眼部肌肉的细微跳动,清晰到每一个毛孔、细纹随光影的变化。
这是一个工厂的流水线,井然有序的机械臂,忙碌的技术工人,一切有条不紊。
这是火焰。
这是雷电。
这是弹珠落地。
这是丝带飘舞。
这是汽车轰鸣。
这是洋流形成。
所有这一切,都来自英伟达Omniverse的虚拟工厂。
而Omniverse能够以假乱真的两个技术基础,是加速计算和生成式AI。
根据老黄的演讲,过去60年,计算机行业只经历了两三次技术变革。
第一次是1964年,IBM System 360开创了计算机兼容性时代,从此,世界上所有的电脑,都有了一种共同的电脑语言。
第二次是2007年,iPhone引入移动计算,把计算机放进了我们的口袋,并实现了云端链接。
但随着CPU性能提升的明显不足,与人类计算需求的指数增长之间的矛盾日益凸显,计算成本将会显著增加(数据中心电力消耗等),这将会导致「计算通货膨胀」。
这个时候,英伟达带着GPU和CUDA来了个“神兵天降”。
英伟达的异构计算,让GPU和 CPU 并行运行,使计算速率最快提升了100 倍,但功耗只增加了大约3倍,成本只增加了约 50%。
一台1000 美元 PC 上加一个 500 美元 GeForce GPU,性能会大幅提升。
也就是说,你买得(GPU)越多,省得越多。
而CUDA则相当于一个软件生态,可以最大限度地开发GPU的潜能,实现加速计算。
到目前为止,CUDA在全球拥有500万开发者和不计其数的用户,这些庞大的用户基础,进一步降低了计算成本,让开发人员有机会去不断探索边界,从而开发出更多的应用。
但这些说到底,只是让计算机更快一点的工具,相当于一个超算中心。
直到2017年,Transformer架构问世,需要更大的数据和算力来训练大语言模型;再到2022年11月,ChatGPT问世,所有的图像、表格、单词、语音、视频,都抽象成了成了一个又一个token。
而用于训练ChatGPT的英伟达的GPU,就成了生产这些token的「AI工厂」。
理论上,这个「AI工厂」可以生成一切,也就是——
模拟一切。
超级AI工厂
构建这个超级AI工厂的基石,是地表最强芯片,Blackwell。
过去8年,从Pascal到如今的Blackwell,英伟达芯片的浮点计算能力,增长了1000倍,而摩尔定律在这八年内的增长大约是40~60 倍。
以GPT-4的模型训练为例,8年前的Pascal所需能耗为1000GWh,这需要一个功率在100 MW 数据中心,耗时大约一年时间,才能训练出一个GPT-4,根本不现实啊。
而Blackwell的能耗是3GWh,能耗仅为8年前的1/350,1万个GPU训练10天就搞定了。
同样的,生成一个token,Pascal 消耗的能量,相当于2 个200W灯泡运行 2 天,而新的Blackwell只使用0.4 焦耳。
你可以说,Blackwell芯片就是专门为训练大模型而生的。
光芯片强大还不够,搭载芯片的服务器,也得足够强大。
简单来说,就是先将两块Blackwell芯片这样⬇️
再这样⬇️
通过这样的模块化架构,将许多个Blackwell芯片整合起来,变成一个“超级加倍”的服务器。
目前,英伟达的MGX超级计算机已经同时集成了72个Blackwell GPU。
光把芯片塞到一起还不够,还得让它们之间正常“通信”。
英伟达又拿出了NVLink芯片,这种芯片拥有 500 亿个晶体管,74 个端口,每个端口 400Gbps,横截带宽 7.2Tbps,内部还具有数学运算能力。
非常抽象对吧。
你也可以这么理解——有了NVLink,你的GPU可以变得这么大⬇️
这是电气奇迹,也是机械奇迹。
这还不算,老黄还给自己上了个强度:
2025 年推出 Blackwell Ultra 芯片;
2026 年推出 Blackwell 的继任者 Rubin 芯片;
2027年推出 Rubin Ultra,新一代基于 Arm 的 Vera CPU,以及 NVLink 6 Switch(3600GB/s)。
总之,依靠超强性能的芯片,加上足够强大的服务器,以及不断的技术迭代,英伟达在AI时代卖铲人的地位,稳如老狗啊。
说了这么多,实际上大家对AI芯片的能耗、算力,其实很难具体感知到。
老黄讲了两个案例。
第一个是地球2,AI这么强大的算力,可以模拟任何一个token,也就是可以创建一个虚拟地球,即数字孪生地球。
这个地球上的一切,都和真实的地球一模一样,如此一来,就可以通过在地球2上预演,来预测未来可能发生的一切,比如气候变化、自然灾害等等,让人类可以更好地避免灾难,提前适应极端气候。
第二个案例,是AI机器人。
机器人在英伟达的虚拟平台Omniverse上,通过数百万次的实验和试错,从零开始学习抓取物体、学会自主导航,学会我们在现实生活中可能尝试的一切,然后将其零成本迁移到现实世界。
当算力足够强大,配合大模型不断生成环境参数和任务去刁难机器人,机器人在虚拟世界学习一天的技能,可能相当于人类在现实世界学习一年甚至10年的程度。
当这些AI驱动机器人被大规模运用到工厂、仓库,运用到医疗、养老,运用到很多人类不愿意从事的领域,各行各业,都将被彻底改写。
黄仁勋说,“这不是未来,这正在发生”。
靠技术引领未来,并借此赚到足够的钱,这是英伟达的牛X之处。
而生成式AI能带领人类走向何处,也许很快就有答案