PCWorld报道,维基百科正面临由人工智能翻译文章引发的准确性问题,这些文章存在事实错误和错误引用,即所谓的“幻觉”现象。

Cover Image

开放知识协会(Open Knowledge Association)使用谷歌GeminiChatGPT等大型语言模型来支付译员报酬,这促使维基百科实施了更严格的审核流程。

尽管存在这些问题,维基百科仍在继续使用人工智能翻译来丰富不同语言的内容,但同时规定译员在出现五次有记录的错误后将被封禁。

大型语言模型——在营销术语中常被称为“AI”——有时会胡编乱造。任何稍微使用过它们的人都会意识到这个问题,而且它们出错的不仅仅是基本信息。维基百科正在努力应对这样一个实例,因为它发现在大型语言模型翻译的文章中存在“幻觉”。

这件事的起因本是积极且利他的:一个名为开放知识协会(OKA)的第三方非营利组织,向将维基百科文章翻译成其他语言的人支付津贴。问题出在依赖谷歌GeminiChatGPT等大型语言模型进行翻译,却缺乏人工审核。

根据404 Media的一份报告,对翻译文章进行例行审核的维基百科编辑们发现,其中存在原文没有的基本信息错误,以及引用缺失、错位或指向与主题完全无关的书籍页码的情况。(许多律师已痛苦地发现,大型语言模型在处理文档方面尤其糟糕。)此前,该系统使用的是埃隆·马斯克(Elon Musk)大型语言模型Grok——该模型被整合到X平台(原Twitter),并以大量生成未经同意的色情材料而闻名——但据报道,开放知识协会已更改了其政策。

维基百科的撰写者几乎完全是无偿的。一个人可以将其编辑维基百科的行为作为其广泛工作的一部分,例如公关人员,但此类编辑需要披露并接受额外审查。在大规模编辑中引入商业元素,即使是出于翻译目的,也可能激励受雇于开放知识协会的译员追求速度而犯错。开放知识协会向全职译员支付的月薪约为400美元。这笔钱不算多,但在许多译员生活的全球南方地区,其购买力要强得多。

尽管维基百科有广泛政策反对大型语言模型生成的文章,但其编辑们已决定继续使用开放知识协会的服务。由于英语维基百科的规模仍然是第二大语言版本的两倍(不包括似乎几乎完全由机器人生成的宿务语维基百科),而使用人数较少的语言版本往往内容匮乏,因此对重要文章的翻译需求极为迫切。但开放知识协会的译员面临着比普通用户严格得多的编辑规范:在出现五次有记录的错误后,开放知识协会的译员可能会被封禁,其之前的翻译成果也可能被清除,除非有更资深的编辑接手负责。


文章标签: #维基百科 #人工智能 #翻译错误 #内容审核 #语言模型

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。