Meta高管内部文件曝光：击败GPT-4成重要目标，训练数据版权存疑

据法院解封的内部消息显示，在开发Llama 3期间，Meta负责AI工作的高管和研究人员一直把击败OpenAI的GPT-4模型当作重要目标。2023年10月，Meta生成式AI副总裁艾哈迈德·阿尔·达赫勒在给Meta研究员雨果·图沃龙的消息中直言：“说实话，我们的目标必须是GPT-4。我们有6.4万个GPU即将到位，我们需要学会如何构建前沿产品并赢得这场竞赛。”

0f9384fd609ace3f000f9b6286e3bee9

虽然Meta会发布开放AI模型，但公司的AI领导层却更关注那些通常不公开模型权重的竞争对手，比如Anthropic和OpenAI，这些公司把模型隐藏在API之后。Meta的高管和研究人员把Anthropic的克劳德和OpenAI的GPT-4当作努力要达到的黄金标准。

法国AI初创公司Mistral是Meta最大的开放竞争对手之一，但在内部消息中被多次提及，且语气轻蔑。阿尔·达赫勒在消息中说：“Mistral对我们来说是小菜一碟，我们应该能够做得更好。”

如今，科技公司都在竞相用尖端AI模型来超越彼此，这些法庭文件揭示了Meta AI领导层到底有多具有竞争性，而且似乎仍然如此。在消息交流中，Meta的AI领导多次谈到他们在获取训练Llama所需数据方面的“非常激进”，一位高管甚至在给同事的消息中说“Llama 3是我唯一关心的”。

本案的检方指控Meta的高管在急于推出AI模型的过程中偶尔走捷径，过程中使用了受版权保护的书籍进行训练。图沃龙在消息中指出，用于Llama 2的数据集组合“很糟糕”，并谈到Meta可以使用更好的数据源组合来改进Llama 3。

然后图沃龙和阿尔·达赫勒讨论了清除使用LibGen数据集的障碍，该数据集包含来自Cengage Learning、Macmillan Learning、麦格劳 - 希尔和培生教育的受版权保护的作品。阿尔·达赫勒询问：“我们里面有没有合适的数据库？有没有你本来想用但因为某些愚蠢的原因没能用的？”

Meta首席执行官马克·扎克伯格此前曾表示，他正试图缩小Llama AI模型与OpenAI、谷歌等公司的封闭模型之间的性能差距。内部消息揭示了公司内部的巨大压力。扎克伯格在2024年7月的一封信中说：“今年，Llama 3在某些领域与最先进的模型具有竞争力并处于领先地位，从明年开始，我们预计未来的Llama模型将成为行业中最先进的。”

当Meta在2024年4月最终发布Llama 3时，这一开放AI模型与谷歌、OpenAI和Anthropic的领先封闭模型具有竞争力，并且超越了Mistral的开放选项。然而，Meta用于训练其模型的数据，据称是扎克伯格批准使用的，尽管其版权状态存在问题，正面临着几起正在进行的诉讼的审查。

搜索结果如下

阅读全文

Meta高管内部文件曝光：击败GPT-4成重要目标，训练数据版权存疑

也可以看看

请愿促苹果更新停产路由器，修复AirBorne漏洞

阅读全文

AMD多款处理器路线图曝光，涵盖美杜莎点、声波等新品

阅读全文

Xbox主机全球涨价，美国涨幅最大，部分游戏将涨至80美元

阅读全文