Open AI回应“抄袭指控”:纽约时报“捏造证据”
OpenAI当地时间周一发表博客文章称,《纽约时报》“故意操纵”ChatGPT重复了该报文章中的内容,该报提起的诉讼“没有法律依据”。
据OpenAI称,《纽约时报》举的例子来自许多第三方网站上发表的旧文章。“(《纽约时报》)似乎故意操纵提示,通常包括冗长的文章摘录,以便让我们的模型重复。”
“我们的模型通常不会像《纽约时报》暗示的那样表现,这表明他们要么有意指示模型重复某些内容,要么从很多次尝试中精心选取了一些例子。”
OpenAI还认为,它们利用互联网公开的数据来训练AI模型是合法的,不违反美国版权法。因为根据美国版权法的“合理使用”原则,利用版权作品进行某些传播、研究等目的可以不被视为侵犯版权。
上周,OpenAI的知识产权和内容首席Tom Rubin在媒体采访中表示,公司近期与数十家出版商展开了有关许可协议的谈判:“我们正处于多场谈判中,正在与多家出版商进行讨论。他们十分活跃积极,这些谈判进展良好。”
在12月27日提起的诉讼中,《纽约时报》指责OpenAI和微软“搭便车”,利用该报数百万篇文章训练他们的大语言模型(LLM),损害了其内容创作和内容变现能力,并向两家公司索赔数十亿美元。
《纽约时报》还认为,OpenAI创建了一种基于“大规模侵权版权”的商业模式,通过盗用该报的知识产权获利,要求OpenAI销毁任何使用其受版权保护的材料的训练数据和聊天机器人模型。
随后,两位非小说类作家提出集体诉讼,称OpenAI在他们的作品上训练LLM,侵犯了他们的版权。此前John Grisham和Jodi Picoult等著名小说家也提起过类似的诉讼。
OpenAI还在其博客中表示,它是从该报12月27日发表的一篇新闻文章中首次听说《纽约时报》的诉讼的。在此之前,它已经与该报就合作伙伴关系进行了富有成效的讨论,并达成了合作协议。OpenAI称,《纽约时报》的“内容对我们现有模型的训练没有任何有意义的贡献”。
《纽约时报》声称,ChatGPT抄袭了其文章的全部摘录,但OpenAI将这种现象描述为“无意记忆”,公司明确试图避免这种现象。