Meta与联合国教科文组织(UNESCO)合作推出了一项名为“语言技术合作伙伴计划”的新项目,旨在收集语音录音和转录文本,以助力未来开源人工智能(AI)的发展。该项目的目标是寻找能够提供超过10小时的语音录音及转录文本、大量书面文本以及多种语言翻译句子的合作伙伴。Meta表示,这些合作伙伴将与Meta的AI团队合作,将这些语言整合到语音识别和翻译模型中,最终这些模型将开源。

GettyImages-2152655802

目前,该项目已经吸引了包括加拿大北部的努纳武特地区(Nunavut)政府在内的合作伙伴。努纳武特是一个人口稀少的地区,当地部分居民使用因纽特语(Inuktut)。Meta在一篇博客文章中提到,该项目特别关注那些服务不足的语言,以支持联合国教科文组织的工作。Meta的目标是开发出能够理解并满足复杂人类需求的智能系统,无论语言或文化背景如何。

与此同时,Meta还发布了一个开源的机器翻译基准,用于评估语言翻译模型的性能。这个基准由语言学家设计,支持七种语言,并且可以在人工智能开发平台Hugging Face上访问和贡献。

虽然Meta将这些项目定位为公益性质,但公司本身也将从中受益。Meta正在不断扩大其人工智能助手Meta AI支持的语言数量,并试点诸如自动翻译等功能。去年9月,Meta宣布开始测试一项工具,用于在Instagram Reels中翻译语音,允许创作者为其视频配音并实现自动对口型。

然而,Meta在其平台上对非英语内容的处理一直饱受批评。据一份报告称,Facebook对意大利语和西班牙语的新冠疫情虚假信息标记率仅为29%,而类似英语虚假信息的标记率则接近70%。此外,该公司泄露的文件显示,阿拉伯语帖子经常被错误地标记为仇恨言论。Meta表示,正在采取措施改进其翻译和内容审核技术。


文章标签: #人工智能 #语言技术 #开源 #Meta #联合国教科文组织

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。