人工智能音频初创公司克里斯普(Krisp)宣布推出一项创新功能,通过AI技术实现通话过程中英语口音的实时转换。目前该功能率先支持将印度英语口音转化为美式英语,在转换过程中完整保留用户原有音色,仅通过调整发音特征实现语音适配。经过企业级场景验证后,测试版功能已正式登陆克里斯普桌面端应用程序,用户可在通话前或通话中随时启用。

Cover Image

公司联合创始人阿尔托·米纳西安(Arto Minasyan)分享研发初衷时表示:“虽然我的英语足够流利,但很多人仍难以理解我的口音。我们认为口音转换能有效提升沟通效率,经过两年研发终于进入测试阶段。”实测显示转换后的语音偶有不自然现象,存在吞字情况,公司回应称这是测试版局限性,后续将通过模型迭代持续优化。

企业测试数据显示,使用该功能后销售转化率提升26.1%,平均订单金额增长14.8%。克里斯普选择优先开发印度口音转换,源于印度裔人才在STEM领域的重要占比。未来计划将支持菲律宾口音等更多语音类型,类似GV投资的萨纳斯(Sanas)等初创公司已在呼叫中心领域实现同类技术应用。

技术团队透露,其AI模型基于数千个涵盖不同口音和方言的语音样本训练而成,并合规使用了会议助手产品的用户授权数据。米纳西安特别指出,该技术无需用户预先进行声纹训练,可直接实时构建说话者的语音特征。

这家2021年完成融资的初创企业计划年内推出支持线下会议的移动端应用,同时正在开发新的Chrome扩展程序以深度适配谷歌会议(Google Meet)服务。


文章标签: #人工智能 #语音技术 #口音转换 #企业应用 #实时处理

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。