最近,Meta在人工智能版权方面的纠纷又有新进展。根据最新提交的法庭文件显示,Meta曾“暂停”了与图书出版商的谈判,这些谈判原本是为了获取用于训练其生成式人工智能模型的数据。这一消息也为此前的相关报道提供了更多依据。
这些文件涉及的案件是Kadrey诉Meta Platforms案。这起案件只是众多在美国法院系统中审理的案件之一,类似的案件将人工智能公司与作者及其他知识产权持有者对立起来。在这些案件中,被告方——人工智能公司,大多声称对受版权保护的内容进行训练属于“合理使用”。然而,原告方——版权持有者,坚决反对这种说法。
文件中包含了原告方律师对Meta员工进行取证调查的部分笔录。这些笔录显示,Meta的一些员工认为,为书籍谈判人工智能训练数据许可可能不具备可扩展性。Meta人工智能合作项目的负责人Sy Choudhury(肖德里)在笔录中表示,Meta向多家出版商发出合作邀请,但得到的回应和兴趣“非常缓慢”。他回忆说:“我们最初通过搜索互联网列出了一份顶级出版商的名单,但很多冷调用的尝试都没有得到回应和反馈。”他还提到:“虽然有一些出版商与我们进行了接触,但数量很少。”
根据法庭笔录,Meta在2023年4月初暂停了某些与人工智能相关的图书许可工作。原因是遇到了“时机”和其他后勤方面的挫折。肖德里还提到,一些出版商,尤其是小说书出版商,实际上并没有拥有Meta考虑许可的内容的版权。他指出:“在小说类别中,我们很快从商业拓展团队那里了解到,我们接触的大多数出版商都表示他们实际上并没有权利将数据许可给我们。因此,与所有作者进行接触将需要很长时间。”
肖德里在取证调查中还提到,Meta至少还有一次暂停了与人工智能开发相关的许可工作。他回忆说:“我们曾尝试从不同的游戏引擎和游戏制造商那里获得3D世界的许可,供我们的人工智能研究团队使用。但就像小说和教科书数据一样,我们几乎没有得到任何回应,甚至无法开始对话。最终,我们决定自己开发解决方案。”
原告方的律师团队包括畅销书作家Sarah Silverman(莎拉·西尔弗曼)和Ta-Nehisi Coates(塔-内西·科茨)。自2023年在加利福尼亚北区联邦地区法院旧金山分院提起诉讼以来,他们已经多次修改诉状。最新的修订诉状指控Meta除了其他侵权行为外,还将某些盗版书籍与可供许可的正版书籍进行交叉比对,以判断是否值得与出版商签订许可协议。
诉状还指控Meta使用包含盗版电子书的“影子图书馆”来训练公司的一些人工智能模型,包括其流行的Llama系列“开放”模型。根据诉状,Meta可能通过种子下载获取了一些图书馆。种子下载是一种在网络上分发文件的方式,要求下载者同时“播种”,即上传他们试图获取的文件。原告方声称,这种行为属于侵犯版权。