Meta周一宣布,将恢复使用欧盟地区用户在Facebook和Instagram上的公开内容(如帖子和评论)训练其人工智能模型。此前因数据隐私监管压力,该公司曾暂停相关计划。Meta表示本周起将开始利用欧盟用户内容进行AI训练,用户与Meta AI的互动数据也将用于模型优化。
这项声明发布前,Meta AI上个月刚刚以受限版本登陆欧盟市场,远晚于其在美国及其他全球市场的首发时间。尽管Meta多年来一直在美国利用用户生成内容训练AI,但在欧盟却因该地区严格的隐私法规(尤其是《通用数据保护条例》GDPR)而受阻——该法规要求AI模型训练必须具有明确的个人数据处理法律依据。
2024年6月,因爱尔兰数据保护委员会(DPC)的反对,Meta曾宣布暂停在欧盟和英国使用用户数据训练AI系统的计划。DPC作为欧盟监管机构代表多个成员国数据保护当局行使职权。至2024年9月,Meta重启了基于英国用户公开帖子的AI训练计划。
Meta在最新博文中表示:“去年我们暂缓了利用公开内容训练大语言模型的计划,等待监管机构明确法律要求。我们欢迎欧洲数据保护委员会(EDPB)12月出具的意见书,该文件确认我们原有方案符合法律义务。此后我们与爱尔兰数据保护委员会保持建设性沟通,期待继续为欧洲用户带来生成式AI的全部优势。”
从本周开始,欧盟用户将陆续收到应用内通知和邮件,说明Meta将使用公开数据及用户与Meta AI的互动记录进行模型训练。这些通知包含退出选项表单链接,用户可申请禁止其数据被用于训练。Meta承诺将尊重所有已提交及新提交的反对请求。
该公司特别强调,训练数据不包含私人聊天记录及欧盟未成年用户的公开信息。“我们认为有责任打造不仅面向欧洲、更要为欧洲量身定制的AI系统。”Meta解释称,“这就需要对多样化的数据进行训练,使生成式AI模型能理解构成欧洲社群的丰富文化细节——包括方言俚语、地域知识,以及各国用户在我们产品中使用幽默讽刺的独特方式。”
Meta表示正效仿谷歌(Google)和OpenAI等企业的做法,这两家公司均已使用欧洲用户数据训练其AI模型。与此同时,爱尔兰数据保护委员会仍在持续关注大语言模型开发者的训练实践,上周刚宣布对埃隆·马斯克旗下xAI公司Grok聊天机器人的训练过程展开调查。