谷歌刚刚为其AI概览功能推出了迄今为止最令人印象深刻(也最令人不安)的补充——名为“音频概览”的新功能,该功能会以两位逼真却非人类的播客主持人风格,生成搜索结果的有声摘要。目前音频概览是搜索实验室(Search Labs)的选配功能,这意味着除非您手动开启实验室选项,否则不会看到该功能。现阶段仅在美国地区提供英文摘要服务。

Cover Image

笔者亲测后发现,实际效果与预期存在差距。当用户在搜索实验室激活该功能后,部分谷歌搜索结果的常规AI概览和“其他人还问”板块下方会出现音频概览框,点击按钮即可生成音频摘要(需等待处理完成)。这些音频片段均为即时生成,刷新页面后可能会得到不同版本。测试中生成的摘要时长在3至5分钟之间,均由同一对AI合成声音以播客形式交替讨论搜索主题。

必须承认,这些声音远比预想中机械化的Siri语音更接近真人。它们能变换语调,使用会话用语,语言表达看似自然。但依然存在违和感——就像两个毫无默契的播客主持人在机械朗读提词器内容,虽未完全达到以假乱真程度,但足以让部分人在初次接触时产生误判。

谷歌会显示用于生成音频摘要的搜索结果来源,方便用户核对AI播客提供的信息。不过由于其拟真度较高,可能会有人误将这些声音当作真实人类而全盘接受其观点——这与文字版AI摘要存在同样隐患。某些细节仍会暴露其非人本质,比如测试中曾出现AI声音自问自答的尴尬场景。虽然两个声音偶尔会使用‘哇!’等情绪化表达来回应趣闻,但始终带着难以忽视的僵硬感,与真人反应存在微妙差距。此外还观察到单词发音错误的情况(如将‘must’念成‘musk’)。

尽管这项功能带着诡异的不协调感,但对视障人士或依赖屏幕阅读工具的用户确实具有实用价值。就AI合成语音而言,其质量已属上乘。但随之而来的是一系列隐忧:AI传播错误信息的风险,以及此类技术对配音演员等职业的冲击。与所有AI创新一样,谷歌的音频概览是把双刃剑。遗憾的是,当前它引发的疑虑远多于惊喜。


文章标签: #谷歌 #AI语音 #搜索功能 #播客 #人工智能

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。