谷歌测试AI播客式音频摘要，搜索结果新增语音功能

谷歌刚刚为其AI概览功能推出了迄今为止最令人印象深刻（也最令人不安）的补充——名为“音频概览”的新功能，该功能会以两位逼真却非人类的播客主持人风格，生成搜索结果的有声摘要。目前音频概览是搜索实验室（Search Labs）的选配功能，这意味着除非您手动开启实验室选项，否则不会看到该功能。现阶段仅在美国地区提供英文摘要服务。

Cover Image

笔者亲测后发现，实际效果与预期存在差距。当用户在搜索实验室激活该功能后，部分谷歌搜索结果的常规AI概览和“其他人还问”板块下方会出现音频概览框，点击按钮即可生成音频摘要（需等待处理完成）。这些音频片段均为即时生成，刷新页面后可能会得到不同版本。测试中生成的摘要时长在3至5分钟之间，均由同一对AI合成声音以播客形式交替讨论搜索主题。

必须承认，这些声音远比预想中机械化的Siri语音更接近真人。它们能变换语调，使用会话用语，语言表达看似自然。但依然存在违和感——就像两个毫无默契的播客主持人在机械朗读提词器内容，虽未完全达到以假乱真程度，但足以让部分人在初次接触时产生误判。

谷歌会显示用于生成音频摘要的搜索结果来源，方便用户核对AI播客提供的信息。不过由于其拟真度较高，可能会有人误将这些声音当作真实人类而全盘接受其观点——这与文字版AI摘要存在同样隐患。某些细节仍会暴露其非人本质，比如测试中曾出现AI声音自问自答的尴尬场景。虽然两个声音偶尔会使用‘哇！’等情绪化表达来回应趣闻，但始终带着难以忽视的僵硬感，与真人反应存在微妙差距。此外还观察到单词发音错误的情况（如将‘must’念成‘musk’）。

尽管这项功能带着诡异的不协调感，但对视障人士或依赖屏幕阅读工具的用户确实具有实用价值。就AI合成语音而言，其质量已属上乘。但随之而来的是一系列隐忧：AI传播错误信息的风险，以及此类技术对配音演员等职业的冲击。与所有AI创新一样，谷歌的音频概览是把双刃剑。遗憾的是，当前它引发的疑虑远多于惊喜。

搜索结果如下

阅读全文

谷歌测试AI播客式音频摘要，搜索结果新增语音功能

也可以看看

喜剧演员因《狮子王》笑话，被索赔超两千万美元

阅读全文

法国Nacon申请破产，拟出售《贪婪之秋》开发商Spiders与动作捕捉工作室

阅读全文

伊桑·霍克新喜剧《她跳舞》口碑佳，烂番茄评分表现亮眼

阅读全文