谷歌CEO畅谈AI革命:未来谷歌会扮演什么角色?
腾讯科技讯 据国外媒体报道,Alphabet兼谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)近期参加Decoder播客节目,接受美国科技媒体网站专访,讨论了人工智能的最大进步、谷歌搜索的未来以及网络的命运。
在5月的谷歌I/O大会上,谷歌把焦点集中在了人工智能技术上–这家搜索巨头正在把人工智能技术融入其几乎所有产品中。其中,谷歌相册(Google Photos)新增的人工智能搜索功能尤为引人注目,它允许用户提出诸如“我的车牌号码是什么?”等问题,并能从用户的照片库中迅速找到答案。在主题演讲中,谷歌高管们共提及“人工智能”一词超过120次。
在I/O大会上,谷歌宣布推出名为“AI Overviews”的全新搜索体验功能。该功能将首先在美国上线,并计划在年底前推广至全球。谷歌宣称,这一功能能够对搜索结果进行智能总结,并提供由人工智能生成的答案。这被视作自谷歌搜索服务推出25年以来最重大的更新之一。谷歌形象地将此描述为“让谷歌为你搜索”。此前,谷歌已对该服务进行了为期一年的测试,称之为搜索生成体验。一些美国用户可能已经体验过这项服务的早期版本,而现在,这项真正改变我们所知网络世界的服务已经到来。
迄今为止,谷歌的生态系统一直基于链接到他人内容的模式:用户在搜索框中输入查询,看到链接,然后选择点击。在这种模式下,流量归属于各个网站,网站所有者能够通过多种方式实现流量变现。在最理想的情况下,每个人都能从中获益。谷歌无疑是目前网络上最大的流量来源,因此,如果它开始通过人工智能回答问题来保留流量,这可能会改变甚至摧毁我们所熟知的互联网生态系统。代表众多知名新闻出版商的新闻/媒体联盟发布了一份新闻稿,警告称搜索中的AI Overviews功能“将对我们的流量造成毁灭性打击”。
外媒近期在讨论“谷歌归零”政策(Google Zero),即,如果企业的谷歌流量降至零,他们的业务将如何发展。如果人工智能聊天机器人和人工智能驱动的搜索结果能够为用户总结一切,用户又为何需要访问网站?如果所有用户都停止访问网站,那么在网站上发布新内容的动机又是什么?是什么阻止了不怀好意的人试图操纵人工智能系统,利用人工智能生成的垃圾邮件充斥网络?如果人工智能最终扼杀了网络,当用户提出问题时,所有的聊天机器人将根据什么内容作出总结?
皮查伊对此有一些自己的看法。首先,他并不相信他深切关心的网络面临如此巨大的危险。在专访中,他提到了《连线》杂志2010年的著名文章《网络已死》(The Web is Dead),并指出,像人工智能这样的全新、变革性技术总是会引起一些短期性的破坏。他表示,将人工智能注入搜索是为了为用户创造价值,而用户的行为已经表明,这些新功能非常有用–甚至在AI Overviews中点击链接的频率更高。然而,皮查伊并未明确说明这对那些最初在互联网上发布内容的人意味着什么。
以下为专访内容全文(有删减):
01.谷歌搜索融入AI新纪元
问:让我们欢迎Alphabet兼谷歌首席执行官桑达尔·皮查伊来到Decoder节目。
皮查伊:你好!非常荣幸能够参加这次的节目。
问:我非常期待与你的对话。感觉每年在谷歌I/O大会上,我们都能进行一次深入的交流,讨论谷歌公布的各项创新。今年,关于人工智能的新闻尤其令人兴奋。我对互联网的未来充满好奇,因此我非常渴望与你探讨这一主题。我想先从一个简单的问题开始。你认为语言等同于智能吗?
皮查伊:这个问题确实颇具挑战性!我并不认为自己是这一领域的权威。不过,我相信语言确实蕴含了丰富的智能,其深度和广度可能超出了我们的预期。它在很大程度上解释了大语言模型所取得的显著成就。但根据我的直觉,作为人类,我们处理信息的方式远比单纯的语言要复杂得多。不过,我必须说,语言的重要性远远超出了人们通常的认识。
问:提出这个问题的初衷在于,当我回顾谷歌I/O大会上发布的关于人工智能的产品和功能,以及谷歌所采取的行动,当观察到其他竞争对手在人工智能领域的进展时,显而易见的是,所有这些进展都极度依赖于语言技术。正是大语言模型引领了本轮对创新和投资兴趣的激增。我不禁质疑,智能的发展是否真的与语言处理能力的提升保持同步。坦率地说,我的观察并不支持这一点。我看到计算机在处理语言方面取得了显著进步,但在某些情况下,它们的智能表现却似乎有所下降。我想知道,你是否也注意到了这种智能与语言能力之间的差距。
皮查伊:确实,这个问题非常深刻。我们之所以让Gemini从一开始就拥有支持多模态的能力–虽然目前外界仅能窥见其端倪,还未全面整合进产品之中–是因为我们希望在音频、视频、文本、图像和编码等方面实现输入输出的多模态协同工作,并且我们利用这些多模态数据来训练模型。或许在下一个发展阶段,我们将能够涵盖比目前以文本为主的情况更广泛的内容。随着我们通过这种多样化的方式吸收更多信息,我们的认知和理解能力也将会得到相应的拓展。我们可以期待,未来将有更多创新和突破。
问:在去年的I/O大会中,谷歌提出了“大胆而负责任”的口号。这正是谷歌所秉持的策略。在今年的大会上,你再次强调了这一点。不过当我们看到人工智能在处理问题时出现的失误,公众的反应似乎随着时间推移而变得更加克制。举例来说,在演示中,你展示了一项多模态视频搜索功能,内容是某人试图修复一台损坏的胶片相机。但搜索结果却给出了错误的答案。视频中被突出显示的建议是:“只需打开胶片相机的后盖,然后轻轻摇晃。”这显然是一个糟糕的建议,因为这样做很可能会破坏所有的胶片。任何真正了解胶片相机工作原理有的人都不会提出这样的解决方案。
皮查伊:我与谷歌团队就此问题进行过沟通。颇具讽刺意味的是,在制作视频的过程中,他们实际上已经咨询了多位领域内的专家,并且所有这些专家都审查了答案并认为它是恰当的。我理解其中的细微差别,并赞同你的观点。显然,我们不希望在没有暗房的环境下曝光胶片。在某些特定情境下,这样的操作是行得通的。如果不想损坏相机,并且所拍摄的内容并不是特别珍贵,那么采取这种做法是合乎逻辑的。
你说得对,这其中包含了许多细微之处。我希望搜索引擎能够提供更多关于答案的背景信息,让人们能够深入探究。我认为,这些正是我们需要持续改进的地方。对于你之前的问题,我认为,能力边界正在不断扩展。如果我们仅仅依赖文本数据进行训练,那么我们的能力将受到限制;随着我们向多模态化发展,我看到了更多的可能性和机遇。
02.网络生态变革下的内容创作者前景
问:让我们深入探讨搜索引擎。这是我最关注的领域–我认为它也是变化最为剧烈的部分。抽象地看,它也是最具吸引力的。你可以向计算机提出问题,而它将愉快地为你提供答案。这种体验让人感到新奇。我感受到了围绕它的激动情绪。发布会上,你宣布AI Overviews功能将被集成到搜索引擎中。这是之前被称为搜索生成体验的进一步发展,该体验已在美国全面推出。我会形容,那些网站制作者对此消息的反应基本上是灾难性的。新闻/媒体联盟的首席执行官在接受CNN采访时表示:“这将对我们的流量产生灾难性的影响。”另一位媒体公司的首席执行官转发给我的新闻报道的标题是:“这是对出版业的致命一击。”对于在搜索引擎中推出AI Overviews功能,你是否预料到了这样的反应?
皮查伊:回想起2010年,那时有媒体宣称网络已死。显然,我一直在网络领域深耕,对网络充满深厚的情感。当从桌面端向移动端的转变发生时,许多人感到忧虑,他们质疑:“哦,屏幕这么小,人们将如何阅读内容?他们为什么会去浏览内容?”我们在2014年开始推出内部称为“网络答案”(Web Answers)的功能,也就是在链接列表之外提供与搜索问题相关的特色片段。你提到的问题事实上就是与此相关。
我依然保持乐观。根据经验,多年来我们所见证的是,人类的好奇心是无穷的。这是我们在搜索引擎领域深刻理解的一点。在这次转变中,我们也将以独特的方式区别于其他公司。作为一个企业,我们深知这个生态系统的价值,它是共生的。如果没有一个丰富的生态系统来创造独特和有用的内容,我们将组织和整理什么?因此,我们深有体会。
我要说的是,通过所有这些转变,事情的发展总是有些不同。我认为用户正在寻找高质量的内容。一个反直觉的现象,我认为几乎总是这样,那就是这不是一个零和游戏。人们对AI Overviews功能的反应非常积极。根据我们的指标,这是我在搜索引擎中看到最积极的变化之一。但人们确实会在此基础上进一步探索。当你提供上下文时,他们实际上会进一步探索。这实际上帮助他们理解,因此他们也与底层内容进行了互动。实际上,如果你在AI Overviews功能中加入内容和链接,它们的点击率会变得更高。
但我也理解这种情绪。这是一个巨大的变化。这些是颠覆性的时刻。人工智能是一个重大的平台转变。人们正在展望未来,并且投入大量精力创造内容。这是他们的业务。因此,我理解这个观点,并不感到惊讶。我们正在与许多参与者直接和间接地进行互动,但我对它实际的发展保持乐观。这是一个好问题,我很高兴进一步讨论。
问:我提出了名为“谷歌归零”的概念,这源自我自身的忧虑。对于几乎所有网站而言,谷歌是网络上最大的流量来源。我观察到,对于许多网站来说,“谷歌归零”正在成为现实。他们的谷歌流量已经降至零,尤其是那些不隶属于任何大型出版集团的独立网站。我们曾报道过一个名为HouseFresh的空气净化器博客,以及一家名为Retro Dodo的游戏网站。这两个网站的运营者都表示:“看看,我们的谷歌流量已经降到了零。我们的业务面临灭顶之灾。”这一切的最终结果是否应该是–那些对视频游戏或空气净化器充满热情、以至于创建了网站并为网络贡献内容的人们,却成为了平台转变中受伤害最深的群体?
皮查伊:讨论个别案例总是充满挑战,毕竟我们的核心任务是满足用户期望。用户通过自己的行为来“投票”,他们正在努力识别什么是真正对他们有价值的。我们的工作是在全球范围内进行的,因此我无法针对特定的网站给出具体答复。这种大规模的操作意味着我们面对的是广泛的用户群体和多样化的需求。我们致力于理解并满足这些需求,同时也认识到,随着技术和平台的发展,一些网站可能会经历流量和关注度的波动。我们的目标是为所有用户提供最佳的搜索体验,同时支持和促进一个健康、多样化的网络生态系统。
问:许多小型企业正在感受到这种转变带来的冲击。他们明确而大声地表达了自己的困境:“我们的生意正在流失。”而谷歌所表达的是:“我们正在积极沟通,我们正在努力参与。”但事实上,这种情况正在清晰地发生。
皮查伊:我并不确定这是否呈现为一个普遍的趋势。我需要从整体上审视数据,所以从个别案例来看,总是有网站经营者来到这个领域并表示:“作为一个特定的网站,我的业绩变差了。”但这就好比一家独立的餐馆声称:“今年我的顾客数量减少了。人们不再外出就餐了”,或者有类似的说法。这并不一定是事实。可能只是隔壁新开了一家生意兴隆的餐馆。因此,很难做出确切的判断。
从我们的角度来看,即使回顾过去十年的历史,我们也为整个生态系统带来了更多的流量,并推动了其增长。你可能在提出一个关于小型网站与更大规模聚合网站之间的次要问题,这是你正在讨论的第二个问题。具有讽刺意味的是,有时候我们所做的调整实际上是为了向小型网站发送更多的流量。一些经常抱怨的网站实际上是中间的聚合者。那么,流量应该流向那些创建了带有菜单内容的网站的餐馆,还是应该流向那些撰写有关这些餐馆的文章的人?这些都是需要深思的问题。我并不是说存在一个绝对正确的答案。
问:谷歌似乎正准备彻底改变游戏规则,直接回答一些根本性的问题。关于未来内容的来源,谷歌希望那些最热心的内容创造者能直接发布信息,成为谷歌综合信息服务的基础。
皮查伊:我赞同这个观点。
03.多模态搜索的创新与挑战
问:不过,这种趋势似乎在网络上正逐渐减弱。
皮查伊:我认为情况恰恰相反。以AI Overviews为例,当你为用户呈现背景信息时,虽然有时用户仅需要一个快速的答案便会离开,但从整体上看,我们观察到的用户行为显示,提供背景信息实际上为用户展示了更多深入探索的起点,这使得他们的参与度提高。这正是随着时间推移推动增长的关键因素。从桌面到移动设备的转变过程中,我们也面临过类似的疑问。事实上,我手头有一本杂志封面几乎想要展示出来,上面赫然写着《网络已死》。大约十年前,就有人提出过“谷歌归零”的观点。但正如你所指出的,谷歌长期以来一直是最大的流量引荐者之一,这并非偶然,因为我们一直深切地关注着这个问题。
回顾过去一年我们在搜索生成体验方面的进展,我们始终在优先考虑那些能够满足用户期望的同时带来更多流量的方法。我们对此深思熟虑,并实际上改变了我们的方法。如果我们认为在某些领域还没有完全做对,我们会谨慎地推出新功能。但让我们感到惊喜的是,用户的参与度提高了,这将随着时间的推移为高质量内容带来更多增长。
关于什么是高质量内容,业界有许多讨论。至少根据我的个人经验,我重视独立的信息来源,我看重小型的内容创作,我渴望听到更多真实的声音。我认为这些都是我们不断努力改进的重要方面。
问:你提到认为会有更多人通过AI Overviews功能点击链接。负责搜索负责人莉兹·里德( LizReid )在她的博客文章中也表达了相同的观点。然而,目前还没有公开的数据支持这一点。谷歌是否会公布相关数据?是否会向公众展示这一现象确实在发生?
皮查伊:从整体角度来看,我认为人们依赖于这个生态系统所提供的价值。如果随着时间推移,用户和网站所有者看不到来自谷歌的价值回报,我认为我们将面临挑战。我们拥有正确的激励机制。但显然,我们必须谨慎。因为存在许多个体差异,部分原因在于用户选择如何行动。这部分很难明确。但我确信,我们在整体层面上致力于做出正确的决策。
问:我阅读了搜索引擎优化(SEO)社区的一些行业刊物,它们对谷歌最近的变化做出了回应。其中有人指出,在谷歌搜索控制台中,我们无法得知点击流量是来自特色片段、AI Overviews,还是普通的谷歌10个蓝色链接。谷歌是否会在未来提供这样的区分?是否会承诺提供这样的数据,以便网站运营者能够审计、验证并衡量AI Overviews是否真的像谷歌所声称的那样带来大量流量?
皮查伊:这个问题对于搜索团队来说非常关键。他们对此问题的思考比我更为深入。我认为,我们一直在努力提供更多的透明度,同时我们也希望内容创作者能够产出高质量的内容。我们的目标是对其进行排名和组织,因此,这其中需要找到一种平衡。如果我们过于具体地规定,人们就会为了这些规定而设计内容。这其中存在一个权衡,所以我并不确定正确的答案是什么。
问:在谷歌提出具体要求与网站制作者实际创造内容之间的权衡,一直是网络发展史上的一个重要议题。无论人们如何看待这种平衡状态,它至少已经达到了一种稳定。然而,现在这种稳定状态正在被人工智能所改变。传统的稳定状态,即10个蓝色链接的搜索结果模式是基于一种互惠互利的交换原则:“我们允许你索引我们的内容,我们将提供特色片段,我们会让你访问我们所有的信息。作为交换,你将为我们带来流量。”这种模式构成了一种公平使用论点的基础,谷歌索引这些内容,而中间并不涉及大量的支付行为。
随着人工智能时代的到来,未来的走向变得扑朔迷离。目前,一些重大的诉讼案件正在进行中,谷歌和OpenAI等公司也在就训练数据与媒体公司达成协议。面对这种情况,人们不禁要问,谷歌是否应该开始支付更多费用以获取用于训练搜索结果的数据?因为这些人工智能生成的片段与传统的10个蓝色链接或其他过去的搜索结果有所不同。
皮查伊:需要明确的是,有关谷歌搜索结果一直是10个蓝色链接的观点其实是一种误解。以我们的移动体验为例,多年来我们已经提供了丰富的答案,允许用户细化问题,推出了特色片段等。我们的产品已经发生了显著的演变。
即便如此,作为一个公司,在面对人工智能的挑战时,我们已经实施了Google News Showcase项目,也签订了许可协议。我们认为,在有益的、变革性的使用背景下,存在公平使用的案例。鉴于你的专业背景,我不会就此与你争辩。但我相信,在某些情况下,我们的模型将带来专门的增量价值,我们将寻求合作伙伴关系来实现这一价值。我们确实计划以这种方式来处理这一问题。
问:换个角度来提问。虽然我对公平使用原则这个话题很感兴趣,但我保证不会过多地和你讨论这个话题。最近有新闻报道称,OpenAI在训练其文声图像模型Sora时使用了YouTube的数据。听闻这一消息,你有何感想?
皮查伊:我们目前并不掌握具体情况的细节。我们的YouTube团队正在密切关注并试图深入了解。我们有明确的服务条款和条件,我们期望所有使用我们平台构建产品的个人或公司都能遵守这些规定,这就是我对此事的基本态度。
问:你认为他们可能违反了YouTube的服务条款和条件?或者,如果确实存在违规行为,那是不可接受的?
皮查伊:确实如此。
问:提出这个问题的原因,是它带有更多情感色彩。当然,也许这样做并不妥当。OpenAI基本上表示:“我们训练使用了公开可获取的信息”,也就是说,他们在网络上找到了这些数据。大多数人并没有机会签订那样的协议。他们没有YouTube的授权专业团队来声明“我们有条款和条件”。他们甚至没有自己的条款和条件。他们仅仅是将自己的作品上传到了互联网。你能理解,为什么创意群体在情感上对人工智能有这样的反应–这种情感与你对OpenAI使用YouTube数据进行训练可能感到的不满是相似的吗?
皮查伊:我完全理解。无论是网站所有者、内容创作者还是艺术家,我都能理解这场变革对他们情感上的影响有多大。即便在谷歌I/O大会上,我们在开发音乐生成等产品时,始终采取的方法是首先为艺术家们提供工具。我们并没有向所有人提供一个可以随意创作歌曲的通用工具。
我们采用这种方法,在许多情况下尽可能将创作者社区置于核心位置。长期以来,我们一直在YouTube上这样做。在这个过程中,我们一直在探索正确的处理方式。但目前也是一个变革的时代,而且在这个生态系统中还有其他参与者。我们并不是生态系统中唯一的参与者。然而,对于你之前的问题,是的,我理解人们对这件事的情感反应。我非常理解并同情人们如何看待这个时刻。
问:他们感觉这似乎是一种掠夺行为–他们将自己的心血倾注于互联网,而大公司却来免费取用,然后基于这些内容创作产品,向用户收取每月20美元的费用,或者将他们的创意作品进行改编,供其他人使用。让他们感到被掠夺的原因是,他们几乎得不到任何价值回馈。这正是我想要探讨的问题:如何将价值重新回馈给他们?如何为那些认为“这感觉像是被掠夺”的小型创作者或独立企业重新激发激励机制?
皮查伊:我们之所以能够在YouTube等平台上取得成功,是因为我们一直在努力解答这个问题。你将看到我们持续深入探索如何更好地实现这一目标。我相信,随着时间的推移,那些能够在这里提供更佳策略的参与者将最终胜出。在我们所做的每一件事中,我们都必须解决这个问题。任何时候你管理一个平台,这都是建立一个可持续长期平台的基础。在人工智能时代,随着时间的推移,那些能够更好地服务支持其平台的内容创作者的参与者将表现出色,而那些做得更好的人将成为最终的赢家。我坚信这是这些事物发展中的一个基本原则。
问:特别值得一提的是,YouTube经常被比作一家版权许可企业–它从创作者那里获得大量内容的授权,并明显地通过其广告模式向创作者支付报酬。音乐产业与YouTube之间有着庞大的版权许可业务,双方之间建立了一种互为依存的关系。YouTube首席执行官苏珊·沃西奇(Susan Wojcicki)曾把YouTube描述为一家音乐服务公司。环球音乐对YouTube上的人工智能应用感到不满。YouTube对此作出了回应,构建了多种工具,并制定了一套关于人工智能能做什么、不能做什么的规则。然而,当人们对于网络上的搜索生成体验或AI概览表达愤怒时,谷歌并没有做出同样的反应。这让我好奇,你如何解释这两种情况的差异。
皮查伊:这与事实大相径庭。
问:你这么认为?
皮查伊:这完全与事实不符。我观察了其他参与者的处理方式。
问:你在谈论OpenAI,它似乎在随意使用网络资源。
皮查伊:通常来说,当我们处理搜索生成体验时,即使在当前这样的时刻,我们花费了大量时间进行测试、迭代和优先考虑各种方法,这是我们多年来一直在做的事情。我坚决不同意我们不倾听外界意见的观点。我们非常关心,我们倾听。人们可能不认同我们所做的一切。当你在运营一个生态系统时,你需要平衡不同的需求。我认为这正是产品成功的关键所在。
问:现在,让我们谈谈这个问题的另一面。人们会操纵搜索结果,这种情况始终会发生,这是一个难以避免的问题。我观察到的另一个现象是,互联网上充斥着人工智能生成的内容。几个月前,一个不道德的搜索引擎优化专家说:“我从一个竞争对手那里窃取了大量流量。我复制了他们的站点地图,将其输入到人工智能系统中,并让它生成与他们的站点地图相匹配的网站副本,我建立了这个网站,从我的竞争对手那里窃取了大量流量。”我认为这是一个糟糕的结果。我们绝不想以任何方式鼓励这种行为。
皮查伊:(摇头)不是这样。
问:这种情况将大规模发生。我们将体验到的互联网将越来越多地在某些重要方面是合成的。你如何在一方面构建为人们创造合成内容的系统,并在另一方面对其进行排名,以便你只获得最好的内容?因为在某个时候,对许多人来说,界限在于,“我想要人类创造的内容,而不是人工智能创造的内容。”
皮查伊:我认为你的问题包含多个层面。首先,我们如何区分高质量和低质量?我实际上将其视为我们的使命宣言,这么多年来一直在定义搜索。实际上,我认为人们低估了。每次你经历这些颠覆性的平台转变时,都会经历这样的阶段。我看到我们的团队投入了巨大的努力。我们的整个搜索质量团队在过去一年中一直在加强我们的排名系统,以更好地识别高质量内容。如果展望未来十年,我认为能够更好地做到这一点的人将最终胜出。
我同意你的评估,人们会重视人类创造的体验。我希望数据能证明这一点。我们必须小心,每当有新技术出现时。例如,如果你谈论电影中的CG特效,电影制片人会非常情绪化地反应,仍然有一些受人尊敬的电影制片人从不在电影中使用CG特效。但也有一些使用CG特效并制作出优秀电影的人。所以你可能会使用人工智能来布置和增强视频中的特效。
我也同意你的观点。我认为,使用人工智能大规模生产内容而不增加任何价值,并不是用户所寻求的。但这是一个广泛的连续体,随着时间的推移,用户正在适应。我们正在努力确保我们以一种负责任的方式做到这一点,但我们也在倾听用户认为什么是高质量的,并试图找到正确的平衡。这个连续体在未来几年将与今天有所不同,但我认为这是搜索质量的核心。我是否对我们能够比其他人更好地处理它感到自信?是的。我认为这就是我们工作的定义。
问:我前几天观看了OpenAI展示的GPT-4o。它看起来与你们在I/O大会上的演示颇为相似。这种多模态搜索的概念,以及可以与之对话的角色——你们有Gems,也是相似的概念——感觉上,大家都在为搜索类体验或代理类体验达成相同结果而竞争。你是否感受到了来自竞争对手的压力?
皮查伊:这与Siri和Alexa的情况并无二致。在科技行业工作,我认为我们都在几年前感受到了不断的创新,那时我们所有人都在开发语音助手。你可以问同样的问题:Alexa试图实现什么,Siri又试图实现什么?这是自然的进步。我认为现在我们有了一项新技术,并且它正在迅速发展。
我觉得这是技术发展的好时期。我们见证了许多创新。我这样认为,并且我相信这样的情况将持续一段时间。我更希望这样。我宁愿处于一个底层技术不断发展的环境中,这意味着我们可以根本性地改善我们提供的体验。我更喜欢这样,而不是处于一个静态阶段,感觉自己无法快速前进。
我们许多人都对强大的助手能实现什么有一个愿景,但我们之前受限于底层技术无法达到那个目标。我认为我们现在拥有了能够更好地服务于这一目标的技术。这就是为什么你看到进步正在发生。我认为这非常令人兴奋。对我来说,我看到的是,“我们实际上可以让Google助手变得更出色。”你在Project Astra中看到了这一点的愿景。当我使用它时,它给我带来了难以置信的神奇体验,因此我对此非常兴奋。
04.AI幻觉困境与精准性追求
问:这让我回想起了我最初提出的问题:语言与智能之间的关系。要开发这些产品,我认为需要一定程度的智能基础。您是否有一个内在的标准,比如“当它达到足够好的水平,我就可以信任它了”?在你们所有的演示文稿和OpenAI的所有演示文稿中,都包含一个免责声明:“请检查这些信息”。对我而言,当我们不再需要这个免责声明时,就意味着它已经准备好了。在传统的10个蓝色链接搜索结果中,并没有“请检查这些信息”的提示。在特色片段的搜索结果中,也没有这样的提示。
皮查伊:你触及了一个更深层次的问题,即幻觉问题尚未解决。在某种程度上,它是一种固有的特性。这正是让这些模型极具创造力的原因。这就是为什么它能立即以你的风格写出一首关于托马斯·杰斐逊(Thomas Jefferson)的诗。它能够做到这一点,它具有难以置信的创造力。但大语言模型并不总是获得事实性信息的最佳途径,这也是我对搜索引擎感到兴奋的原因之一。
在搜索引擎领域,我们正在以一种方式引入大语言模型,但我们会将其与我们在搜索领域的所有工作相结合,并赋予它足够的上下文,以便我们能够提供更好的用户体验。我认为,你之所以看到这些免责声明,是因为它们的固有特性。有时候,模型仍会出错,但我不认为我们应该因此而低估了它的实用性。那样的想法是错误的。
Google Lens是一个很好的例子。当我们最初推出谷歌镜头时,它并不能很好地识别所有物体。但随着时间的推移,年复一年的进步非常显著,用户也越来越多地使用它。现在,我们已经通过Google Lens进行了数十亿次查询。这是因为底层的图像识别技术,结合了我们对知识实体的理解,已经随着时间的推移得到了显著扩展。我将此视为一个连续的过程,我再次强调,用户会用他们的行动来“投票”。在第一年,使用Google Lens的人数较少。我们也没有将它应用到所有地方,因为我们意识到了产品的局限性。
问:当你在与DeepMind Google Brain团队交流时,解决幻觉问题是否已列入发展蓝图?
皮查伊:这个团队已经更名为Google DeepMind。我们在取得进展吗?我们确实在进步。如果我们审视年度的事实性指标,我们显然已经取得了显著进步。我们所有人都在努力改进,但这个问题尚未完全解决。他们是否正在研究一些有趣的想法和方法?是的,但最终结果还需时间来证明。我认为,大语言模型只是人工智能的一个方面。我们正以更广泛的方式探索人工智能,但这是我们都在努力取得更多进展的领域。
问:五年后,这场技术范式转变,我相信我们将经历它。那么五年后,你心目中最佳的网络版本是什么样的?
皮查伊:我希望网络在模态上更加丰富多样。目前,人类获取信息的方式尚未在网络上得到完整体现。如今,信息以不同形态存在–你有网页,有YouTube等。但随着时间的推移,我希望网络能变得更加多模态、更加丰富、更具交互性。
尽管人们可能利用人工智能产生大量垃圾信息,但每次新技术出现时,人们一开始并不知道如何有效使用它。当移动互联网兴起时,人们最初只是将网页内容硬塞进移动应用中。随后,开发者开始创造出真正为移动设备量身定制的应用。人们利用人工智能解决新问题、满足新用例的方式还有待发掘。当这一切实现时,我相信网络也将变得更加丰富多彩。例如:根据用户需求动态构建用户界面。不同的用户有不同的需求,但目前我们还没有实现动态构建用户界面。AI将有助于我们随着时间推移逐步实现这一点。当然,如果使用不当,可能会以错误的方式实现,人们可能会以肤浅的方式使用它,但总会有富有创造力的企业家找到一种非常好的方法来实现它,从而带来伟大的创新。
问:谷歌通过搜索、Chrome浏览器以及所做的一切,在网络发展上创造了许多激励机制。如何确保这些激励与既定目标保持一致?也许这里最重要的一点是,网络生态系统正处于变革之中,谷歌需要建立和重建信任。你如何看待确保这些激励指向正确的目标?
皮查伊:事实上,并非一切都在谷歌的控制之下。你需要接受许多关于cookie的对话框等。因此,我认为有许多事情是超出我们控制范围的。你可以调查100位用户来了解他们的看法。关于我们希望创造什么样的激励机制,我认为这是一个复杂的问题,即如何在可能的任何规模上奖励原创性、创造力和独立的声音,并给予它们在这个内容生态系统中茁壮成长的机会。这就是我所考虑的,也是搜索团队所考虑的。我认为这是一个重要的原则,这对网络来说很重要,对我们作为一家公司来说也很重要。
问:非常感谢!感谢你抽出宝贵时间参与节目