英伟达订单“多到不可思议” 但 AI 大模型故事已不好讲了
大模型的“神话之战”
增长推力渐弱的当下,大模型是为数不多的亮点,过去半年的狂热炒作后,一些人担心被 AI 替代、颠覆,另一些人决心在被替代前跳入潮流,还有一些人认为没什么用。这种时候往往也是资本愿意投资的阶段,分歧才能产生更大的收益。
在增长越来越稀缺、确定性越来越难得的此刻,AI 大模型许诺了一个少有的新可能。根据赛迪顾问的统计,仅今年1~7月,中国就有64个大模型问世,而截至7月末,国产大模型累计发布数量达到了130个。
今年以来,百度、阿里、华为相继发布了自己的大模型产品。人们无比相信那个比“移动互联网大10倍”的平台级大机会,在GPT-4推出不过20余天时,已有超10余家创业公司坐上大模型牌桌,总融资额数十亿美金。此后包括大厂在内的20多家公司公布了自研AI大模型,“就连上古神仙的名字都不够用了,诸如盘古、昆仑、混元、太初等等”。
为了开发顶尖的大模型,需要高度专业化的人才团队来进行开发、调试和维护。这些团队需要具备深厚的技术背景和领域知识,以确保模型能够在特定领域内取得良好的效果。
企业不得不吸纳大量的人工智能领域人才,从而掀起了一场激烈的“抢人大战”。如今,大模型的相关岗位,如机器学习工程师、数据科学家、领域专家等,其薪酬水平也急转直上百万年薪只是起步。本来国内大模型相关人才就颇为稀缺,在风口之上翻倍只是小意思,网传张一鸣为了挖OpenAI的大牛开出一亿美元的薪酬,急用人的时候甚至有一些产品岗也转发做大模型。
看上去轰轰烈烈机会就在眼前,但这个机会能够有资格抓住的确不多。
前不久,在Waves大会的一场圆桌论坛上,中国人民大学高瓴人工智能学院卢志武教授,就质疑了所谓“国产大模型的春天”。在他看来,这不过是很多公司在“微调国外底座模型”的假象。
这波大模型浪潮里,玩家很多,但很多并不具备从底层开始搭建大模型的能力。因为它们面临着缺少算法积累、计算资源,训练数据差,配置成本高以及缺乏对产业的理解和智能化经验等各个问题。这些需要深厚的积累,很难一蹴而就。
玩家很多这不假但同质化严重,不光没啥价值还会造成社会资源的浪费。
于是李彦宏表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,“卷大模型没有意义,卷应用机会更大”。他分析说,移动互联网时代操作系统只有安卓和iOS,但特别成功的应用却很多,只有在大模型基础上产生足够多的AI原生应用,才是一个健康的生态环境。
李老板说的也是大实话,但是一个充分竞争的市场谁会自愿退出呢?做应用层始终还是要受制于平台的,更何况应用层目前并没有什么亮眼的应用。
眼下劝大家进军应用层缺少商业动力,又面临大公司几乎全覆盖的应用降维打击,大部分人还是看得明白的。
没人能“阻止”英伟达
制约 AI 人工智能发展最大的桎梏是什么?如果在几年前,这个答案可能五花八门。但在大模型盛行的当下,这个问题只有一个答案——算力不够!
如果说数据是大模型世界的生产原料,那么算力则是大模型的生产力。OpenAI此前公布过一组数据,目前大模型训练所需算力的增速保持在3-4个月/倍速度增长,远超摩尔定律18-24个月/倍。
算力是支撑大模型运转起来的原动力。强大的算力,意味着更快的数据处理速度、更强的大模型服务能力。
越来越多的人工智能初创公司和服务导致对 A100 和 H100 等高端 GPU的高需求,从而压垮了 Nvidia 及其制造合作伙伴台积电,两者都在努力满足供应。
Reddit 等在线论坛上充斥着对 GPU 可用性的不满,这呼应了整个技术社区的情绪。情况变得如此可怕,AWS 和 Azure 都别无选择,只能实施配额系统。
这个瓶颈不仅提高了初创企业的成本,也挤压了初创企业的发展空间。
对于 OpenAI 这样的科技巨头来说,这是一个绊脚石。最近在伦敦举行的一次非正式会议上,OpenAI首席执行官 Sam Altman坦诚承认,计算机芯片短缺正在阻碍 ChatGPT 的进步。据报道,Altman 感叹计算能力的缺乏导致 API 可用性低于标准,并阻碍 OpenAI 为 ChatGPT 推出更大的“上下文窗口”。
所以才会有国内大厂集中采购50亿美元的A100芯片,没有算力维持,大模型都无从谈起更别说产品迭代了。但这50亿订单交付也不是今年就能给,其中,只有10亿美元的货能赶在年内交付,另外八成订单也要等到2024年才能陆续交付。
早在第一财季电话会上,黄仁勋就感叹,数据中心业务的“订单多到不可思议”,英伟达的核心要务是开发并保证生产尽可能多的符合市场需求的先进芯片。
但真的来到第二财季,外部需求的爆发仍然超出了黄仁勋的预期。据CoreWeave联合创始人兼CTOBrian Venturo表示,今年一季度,获取英伟达GPU还很容易,但从4月份开始,市场忽然变得异常紧张,即使现在立即订购,交货时间也要等到2024年Q1甚至Q2。
一般来讲生意好做的时候就是企业大幅扩张的时候,这个时期不太会对费用比控制太严格,但英伟达偏偏在“降本增效”上做到了极致,震惊了华尔街。
在营收大幅增长的同时,英伟达对于成本费用的控制却异常的严苛,该季度研发费用为20.4亿美元,同比增长11.8%,销售和其他费用6.22亿美元,同比增长5.1%,相比营收超过100%的增长,成本的控制可谓做到了极致。
在发布财报的同时,英伟达同时宣布了在两天前的董事会上,公司刚刚表决通过了额外250亿美元的股票回购计划,在第二季度中,英伟达动用了32.8亿美元回购了750万股。“课代表”般的公司如今可不多了。
今年以来,随着AI热潮的推动,英伟达的市值已经成功站上1万亿美元,从各种估值方式来看,英伟达的估值无论和自身历史纵向比较,还是与行业整体横向比较,都出于较高的估值区间。但英伟达的管理层对估值还是有所不满,认为英伟达仍然被华尔街低估。
这么想也不是不行,AI最终市场会有多大没有人能给出准确答案,英伟达仍然在研发更先进的产品,还将带给市场怎么样的震惊还未可知。AI景气度还在,英伟达就不会到顶。
不过,虽然英伟达没有到顶,但华尔街的秃鹫们已经开始做空,想要撕开一些口子,猛砸下去看看到底是泡沫还是坚冰。我们首席会持续关注这个话题。
“商业化难题”浇灭资本热情
就算是算力无限制供应,十倍互联网规模的市场就真的会到来吗?答案是不一定,至少目前很困难。
华为轮值董事长胡厚崑在 WAIC 开幕式上说,“大模型的目标是应该服务于不同行业的不同应用……才能发挥更大价值。” 腾讯集团高级执行副总裁汤道生在后续发言中也表达了类似观点:“行业大模型是企业拥抱大模型的更优选项。”
一位 AI 独角兽公司首席科学家说,他们从 2018 年就开始研究大语言模型,前两年也做出来了写文章的应用,因为没客户买单,公司就一直没有加大投入。ChatGPT 火了后,他们也发布了自研大模型,但暂时不打算训练规模更大的模型,因为客户觉得性价比有限,毕竟训练一个参数千亿的模型要花千万元人民币。
据IT桔子等数据显示,2014年至2018年,中国人工智能领域的IPO退出平均回报仅为1.83倍,2018年全年有将近90%的人工智能公司处于亏损状态。2019年,“投资人逃离人工智能”刷屏,经过几年凋敝,除联想之星、创新工场等机构外,国内真正在持续关注AI的投资人寥寥,大基金也几乎没有专人在长期覆盖。
所以新的故事是“大模型如何赋能千行百业”。
一位投资人曾在社交媒体上表示,旨在满足数据采集、标注、模型调度等MLOps需求的公司,会面临“中间商难赚差价”的夹心尴尬——前有免费开源工具,后有云厂商打包工具和服务。同时,“国内客户付费习惯仍然没有很好地养成,尤其在企业开支紧缩的经济恢复期”。
就算是老老实实很早切入应用层的明星公司,如今也迅速衰落。这在海外市场已有表征。例如去年尚风头无两的美国独角兽Grammarly和Jasper,在GPT4发布后,现有功能即被代替,价值迅速被摊薄,朱啸虎公开称“这两家公司或将很快归零,根本守不住”。
那么大厂自己做的应用产品怎么样呢?
那就不得不提到妙鸭相机这一款迅速蹿红的AI应用,七麦数据显示,于IOS端,妙鸭相机APP在7月28日上线以来,短时间内下载排名急速爬升。8月8日妙鸭相机APP开始霸榜“社交”,12日拿下总榜第一。
不过这波高峰,也只维持了一周时间。8月16日之后,妙鸭相机后劲乏力,排名一路下滑。截止目前,“社交”榜单排名15名左右,“应用”榜单则在200名开外。妙鸭相机的问题不只在于热度下滑,在付费内容和差异化上并不出众才是最大的问题。
事实上,昙花一现的AI生成图像现象级产品也并不罕见,如Sensor Tower《2023年AI应用市场洞察》数据显示,随着DALL-E和Stable Diffusion模型的迭代与成熟,Al+图像应用市场繁荣发展,2023年上半年相关应用超过150余款,下载量突破1亿次。
其中,“Lensa AI”自2022年11月下旬一经推出,应用下载量随即迅速攀升,12月下载量突破1700万次。仅过了一个多月,“Lensa AI”的下载量就直线下滑,下载量跌破了200万。
手握国内首个基础大模型的百度,也深知这一点。其资深副总裁、移动生态事业群组总经理何俊杰近日也也认为,「烧钱做大模型」这事该往前一步了,下一程是应用层之战。「应该烧脑去做AI应用」,在接受第一财经《总编时刻》访谈时,何俊杰透露百度内部正在充分「赛马」,各个业务线都有阶段性的「军令状」,看哪条线能率先跑出黑马。
写在最后
2017年,扎克伯格回到哈佛,进行毕业典礼演讲。他说:“让我告诉你们一个秘密,‘没有人一开始就知道(Facebook)该怎么做,想法不会在最初就完全成型。只有当你开始行动时,事情的脉络才会逐渐清晰,你只需要开始行动。如果从一开始我就要完全弄明白‘如何连接人’,我永远做不出Facebook。”
当然有勇气投身大模型还远远不够,需要产学研的积累打磨,深度学习从学术走向产业,在视觉、语音等方面大放异彩用了十几年,在这个过程中有无数的公司倒下,行业经历着外人难以想象的内卷和迭代。大模型的情况更为复杂,但只要路径正确剩下的无非是试错迭代,尽量不要倒在黎明前。
不要责怪投资人说投100家AIGC公司,不如直接投英伟达和微软来得实在,怪他们浅薄势利眼。正如李彦宏所说AI原生应用要能解决过去解决不了、解决不好的问题,应用才是大模型存在的意义。还没发挥价值就上来谈钱景恐怕也不合适。