最近,人工智能公司面临的版权诉讼有了新的动向。美国联邦法官在汤森路透(Thomson Reuters)起诉罗斯智能(Ross Intelligence)的案件中做出了简易判决,判定罗斯使用路透的内容训练其人工智能法律研究平台,构成对路透知识产权的侵犯。这一判决可能会对目前正在美国法院审理的39起与人工智能相关的版权诉讼产生影响。
罗斯被指控使用了路透法律研究服务Westlaw的“案头摘要”来训练其人工智能。这些案头摘要其实是对法律判决的简要总结,而罗斯将其人工智能宣传为一种能够分析文件并在法庭文件中进行查询搜索的工具。然而,罗斯声称其对这些受版权保护的案头摘要的使用是合法的,因为这种使用具有“转化性”,即它们将这些案头摘要重新利用,服务于完全不同的功能和市场。
但本案的主审法官斯特凡诺斯·比巴斯(Stephanos Bibas)并不认同这一说法。比巴斯认为,罗斯只是对Westlaw的案头摘要进行了重新包装,直接复制了Westlaw的法律研究服务。在他看来,罗斯的平台并没有赋予这些案头摘要新的含义、目的或评论因此,无法支持罗斯所谓的“转化性使用”主张。此外,比巴斯还指出,罗斯的商业动机也是其抗辩失败的原因之一。罗斯试图从一款与Westlaw直接竞争的产品中获利,而其对受知识产权保护的Westlaw材料并未进行显著的“重新语境化”。
雪城大学(Syracuse University)知识产权法教授舒巴·戈什(Shubha Ghosh)将这一判决称为汤森路透的“重大胜利”。尽管案件还将继续进行庭审,但汤森路透已经获得了简易判决,这是诉讼现阶段的胜利。戈什表示:“法官还确认罗斯在其抗辩(如合理使用和合并原则)上无权获得简易判决。因此,案件将继续进入庭审阶段,而汤森路透已经取得了重大胜利。”
不过,这一判决的应用范围较为狭窄。目前,另一宗人工智能版权案件中的至少一组原告已请求法院参考比巴斯的判决,但尚不清楚这一判例是否会说服其他法官。
比巴斯在判决意见中特别区分了“生成式人工智能”和罗斯所使用的人工智能。罗斯所使用的人工智能并未生成内容,而只是返回已经写好的司法意见。而生成式人工智能,如OpenAI和Midjourney等公司所涉及的技术,才是当前版权诉讼的核心。生成式人工智能通常从网络上的公共来源获取大量内容进行训练。在输入大量样本后,它可以生成语音、文本、图像、视频、音乐等。
大多数开发生成式人工智能的公司认为,合理使用原则保护了他们抓取数据并用于训练的行为,而无需补偿甚至提及数据所有者。他们声称,他们有权使用任何公开可用的内容进行训练,并且他们的模型实际上输出的是具有转化性的作品。但并非所有版权持有者都同意这一观点。一些人指出了一种被称为“重复生成”的现象,即生成式人工智能创建的内容与其训练内容极为相似。
美国律师事务所Hall Estill的专利律师兰迪·麦卡锡(Randy McCarthy)表示,比巴斯对“对原作品市场的影响”这一关注点可能是版权持有者对生成式人工智能开发者诉讼的关键。但他也警告称,比巴斯的意见相对较窄,且可能在上诉中被推翻。“至少在这个案例中,有一点是明确的:仅仅将受版权保护的材料用作人工智能的训练数据,不能被认定为合理使用,”麦卡锡对TechCrunch表示,“但这只是更大战争中的一场战斗,我们需要看到更多发展,才能从这一案例中提炼出关于将受版权保护的材料用作人工智能训练数据的法律。”
TechCrunch采访的另一位律师马克·莱扎马(Mark Lezama)则认为比巴斯的判决可能具有更广泛的影响。他认为,法官的推理可能适用于各种形式的生成式人工智能。“法院在法律层面拒绝了合理使用抗辩,部分原因是罗斯使用汤森路透的案头摘要开发了一个竞争性的法律研究系统,”他说,“尽管法院暗示这可能与生成式人工智能的情况有所不同,但很容易想象一个新闻网站会争辩称,将文章复制用于训练生成式人工智能并无不同,因为生成式人工智能利用这些受版权保护的文章与新闻网站竞争用户关注。”
换句话说,在这一判决之后,与人工智能公司对簿公堂的出版商和版权所有者有了一些乐观的理由——但这种乐观理由是有限的。