麻烦来了!两位作家起诉ChatGPT,称其侵犯版权
(起诉书)
起诉书中提到,美国马萨诸塞州作家保罗 · 特伦布莱和莫娜 · 阿瓦德表示,ChatGPT 未经他们同意,直接复制了书籍的数据来进行训练,这侵犯了作者的版权。
特伦布莱的作品有《世界尽头的小屋》,阿瓦德的代表作为《看待胖女孩的 13 种方式》和《兔子》。
这两位作家称,ChatGPT 写出的书籍简要,和他们发表的文章一模一样,这说明训练 ChatGPT 的数据库,是包含了他们的作品的。
聊天机器人是在大量的文本数据上进行训练的,OpenAI 没有透露训练 ChatGPT 具体使用了哪些数据,但该公司表示,它通常会抓取网络数据,包括使用档案图书和维基百科等。
书籍是训练人工智能的理想选择,因为它们往往包含 ” 高质量、精心编辑的长篇文章 “,储存了人类思想的精华。
根据起诉书显示,OpenAI 的训练数据超过 30 万本书,其中包括本就备受争议、版权归属不明晰的 ” 影子图书馆 “。
但要证明 ChatGPT 是如何以及在哪里收集到这些信息的,以及这些作者是否遭受了经济损失,可能是一个挑战。因为 ChatGPT 也利用了大量的互联网信息进行训练,包括互联网用户对这些书的讨论。
该诉讼代表美国全国范围内的版权所有者,寻求一笔数额不详的赔偿金。目前,OpenAI 的代表没有对此事进行回应。
萨塞克斯大学知识产权法专业的 ndres Guadamuz 表示,这是针对 ChatGPT 的第一起涉及版权的诉讼。他补充说,这起诉讼将探讨生成式人工智能领域 ” 合法性边界 ” 的问题。
而就在几天之前,OpenAI 在加利福尼亚州同样被多方而就在几天之前,OpenAI 在加利福尼亚州同样被多方提起集体诉讼,起诉书称 OpenAI 在未经允许的前提下,在互联网上窃取和挪用了大量私人数据来训练 ChatGPT。