据法院解封的内部消息显示,在开发Llama 3期间,Meta负责AI工作的高管和研究人员一直把击败OpenAI的GPT-4模型当作重要目标。2023年10月,Meta生成式AI副总裁艾哈迈德·阿尔·达赫勒在给Meta研究员雨果·图沃龙的消息中直言:“说实话,我们的目标必须是GPT-4。我们有6.4万个GPU即将到位,我们需要学会如何构建前沿产品并赢得这场竞赛。”

0f9384fd609ace3f000f9b6286e3bee9

虽然Meta会发布开放AI模型,但公司的AI领导层却更关注那些通常不公开模型权重的竞争对手,比如Anthropic和OpenAI,这些公司把模型隐藏在API之后。Meta的高管和研究人员把Anthropic的克劳德和OpenAI的GPT-4当作努力要达到的黄金标准。

法国AI初创公司Mistral是Meta最大的开放竞争对手之一,但在内部消息中被多次提及,且语气轻蔑。阿尔·达赫勒在消息中说:“Mistral对我们来说是小菜一碟,我们应该能够做得更好。”

如今,科技公司都在竞相用尖端AI模型来超越彼此,这些法庭文件揭示了Meta AI领导层到底有多具有竞争性,而且似乎仍然如此。在消息交流中,Meta的AI领导多次谈到他们在获取训练Llama所需数据方面的“非常激进”,一位高管甚至在给同事的消息中说“Llama 3是我唯一关心的”。

本案的检方指控Meta的高管在急于推出AI模型的过程中偶尔走捷径,过程中使用了受版权保护的书籍进行训练。图沃龙在消息中指出,用于Llama 2的数据集组合“很糟糕”,并谈到Meta可以使用更好的数据源组合来改进Llama 3。

然后图沃龙和阿尔·达赫勒讨论了清除使用LibGen数据集的障碍,该数据集包含来自Cengage Learning、Macmillan Learning、麦格劳 - 希尔和培生教育的受版权保护的作品。阿尔·达赫勒询问:“我们里面有没有合适的数据库?有没有你本来想用但因为某些愚蠢的原因没能用的?”

Meta首席执行官马克·扎克伯格此前曾表示,他正试图缩小Llama AI模型与OpenAI、谷歌等公司的封闭模型之间的性能差距。内部消息揭示了公司内部的巨大压力。扎克伯格在2024年7月的一封信中说:“今年,Llama 3在某些领域与最先进的模型具有竞争力并处于领先地位,从明年开始,我们预计未来的Llama模型将成为行业中最先进的。”

当Meta在2024年4月最终发布Llama 3时,这一开放AI模型与谷歌、OpenAI和Anthropic的领先封闭模型具有竞争力,并且超越了Mistral的开放选项。然而,Meta用于训练其模型的数据,据称是扎克伯格批准使用的,尽管其版权状态存在问题,正面临着几起正在进行的诉讼的审查。


文章标签: #Meta #OpenAI #人工智能 #版权 #竞争

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。