路透社消息称,最近美国人工智能公司OpenAI最近再遭一批作家起诉,包括普利策奖得主迈克尔·查伯恩、戏剧家大卫·亨利·黄在内的一群作家提起了集体诉讼。
诉讼称,OpenAI在其训练ChatGPT聊天机器人时,未经授权使用了他们的受版权保护作品。尤其通过让ChatGPT学习他们的受版权保护作品来进行模型训练,不仅侵犯了版权,还通过ChatGPT产生的内容分析和总结构成了衍生侵权作品。
多位作家表示,OpenAI通过非法使用这些作品训练其GPT语言模型,获得了利益和利润。如果没有在这些作品上进行模型训练,ChatGPT不可能具有总结和分析这些作者内容的能力。因此ChatGPT的输出实际上是对原作品的侵权“衍生”作品。
诉讼还指出OpenAI明知训练数据中包含受版权保护内容,其行为有违使用条款,属于故意侵权。据悉,诉讼寻求集体诉讼地位,要求法院禁止OpenAI进行这种“非法商业行为”,同时判决OpenAI须就侵权行为支付相关赔偿和处罚。
其实这已经不是首次有作家针对OpenAI发起集体诉讼,早在今年6月和7月就分别有Paul Tremblay、Mona Awad和喜剧演员莎拉·西尔弗曼等人分别针对ChatGPT的训练数据问题发起了类似的集体诉讼,起诉OpenAI和Meta侵权。
事实上该诉讼至少是作者针对微软支持的 OpenAI 提起的第三起版权侵权集体诉讼。微软、Meta Platforms 和 Stability AI 等公司也因在人工智能训练中使用他们的作品而被版权所有者起诉。
OpenAI 和其他公司认为,人工智能培训合理使用了从互联网上抓取的受版权保护的材料。旧金山的新诉讼称,书籍、戏剧和文章等作品对于 ChatGPT的培训特别有价值,因为它们是“高质量长篇写作的最佳范例”。
OpenAI创造的大型语言模型ChatGPT自去年11月推出以来大受欢迎,但其训练数据的来源一直饱受争议。此次集体诉讼表明,虽然人工智能带来许多惊叹,但技术公司仍需正视并处理好训练数据方面的潜在风险与争议。
连续的诉讼表明,众多作家认为OpenAI利用他们的作品训练AI模型是在侵犯版权,需要通过法律途径维护权益。本次诉讼也再次将人工智能领域的版权问题推到舆论焦点,有望促使相关企业提高对版权的重视。而OpenAI还需就其训练数据的版权问题进行反思,并采取措施避免侵犯作家版权,否则可能难以摆脱持续的版权纠纷。
目前,业界期待OpenAI等公司能给出何种回应,并采取哪些措施改善数据采集与使用的合规性。