谷歌正式推出语言模型Gemma,声称超越竞品
在周三发布的博客文章中谷歌透露,Gemma专注于文本处理,其构建基础与该公司旗舰人工智能模型Gemini的研究成果和技术一脉相承。Gemma将有两个版本,分别为70亿参数和20亿参数。其中,前者针对计划运用高性能人工智能芯片和数据中心开发人工智能软件的客户,后者则更适合想要构建更具经济效益应用程序的客户。
虽然这些模型的构建相对简单,但在速度和成本方面却更具优势。谷歌声称,Gemma在关键基准上“显著超越了更大的模型”,包括Meta Llama-2,并且“能够直接在开发者的笔记本电脑或台式电脑上运行”。
尽管谷歌开发了支持生成式人工智能的技术,但在构建能够自动完成总结报告、编写软件代码或创建广告活动等任务的产品时,却落后于OpenAI及其合作伙伴微软。然而,Gemma的发布似乎与谷歌在人工智能领域的早期目标形成鲜明对比。对此,谷歌解释称,这仅仅是其开源世界创新历程的延续。
谷歌领导层强调,该公司早先的举措包括向开发者免费开放内部人工智能引擎TensorFlow,并向全球推出所谓的“转换器”,这是构成当今最流行大语言模型的关键组件,包括OpenAI备受欢迎的人工智能聊天机器人ChatGPT。
谷歌DeepMind的产品管理总监特里斯·沃肯廷(TrisWarkentin)在接受采访时表示:“这对我们来说是一个新的机会,我们可以与社区合作共同研发新产品,并与谷歌内部和外部人员合作,在人工智能研发方面创造新的机会。”
在过去的一年里,谷歌对于开源人工智能技术的态度发生了显著变化。去年,一篇由谷歌高级软件工程师卢克·塞尔诺(LukeSernau)撰写的批评文章在内部广为流传。他直言不讳地指出,许多独立研究人员利用开源工具在人工智能领域取得了惊人的进展。塞尔诺在文章中写道:“我们没有秘方,我们最大的希望是向谷歌以外的公司学习,并与之合作。”
随着时间的推移,谷歌对“专有人工智能”的关注度逐渐降低,转而采取更为广泛的方法,其中包括深入研究开源工具。
今年1月,谷歌与初创公司HuggingFace达成合作,将后者的人工智能软件托管在谷歌的云计算网络上,使开源开发者更容易获得这项技术。此次,谷歌还与HuggingFace合作,确保Gemma模型在发布时得到其全面支持。
谷歌开发者关系主管珍妮·班克斯(JeanineBanks)解释说,Gemma的发布是对谷歌旗舰人工智能模型Gemini的补充。她表示,公司在征求开发者反馈后发现,许多开发者不仅使用API,还使用开源模型。而开源模型在开发者希望使用自己的数据构建应用程序,或在自己的硬件或基础设施上测试软件时特别受欢迎。她进一步指出:“我们认为Gemma的开源模式真正支持的是这种跨平台模式。”
值得一提的是,Gemma模型与谷歌云的企业平台VertexAI集成,允许开发者在整个人工智能工具构建过程中都留在谷歌的生态系统内。此外,开发者使用该模型开发的应用程序将享有“商业许可”,这意味着开发者将拥有软件产品的所有权,并能够应用对他们有意义的商业模式。
不过,开源人工智能模型也面临被滥用的风险。为了降低这种风险,谷歌强调开发Gemma符合其负责任的人工智能原则。班克斯称,当开发者接受Gemma的许可条款时,意味着他们也同意遵守谷歌对人工智能模型被如何使用的期望,并且必须使用如Kaggle和HuggingFace等要求公开开发软件的平台。她警告说:“虽然AI的广泛应用至关重要,但它也存在潜在的危害。”