当前人工智能企业似乎正极力推动用户与产品进行语音交互,Meta(原Facebook)、谷歌(Google)、OpenAI和Anthropic等科技巨头纷纷升级语音转文字技术,让用户能像与真人对话般自然地与AI助手交流。

Cover Image

但初创公司Wispr Flow认为其听写技术能超越行业巨头——该技术支持超100种语言,近日该公司在原有Windows和Mac应用基础上,推出了兼具键盘功能的iOS应用,实现在任意应用内语音输入。

或许你会认为这不过是又一家语音转文字公司,但笔者实测后对Wispr Flow印象深刻,作为印度用户,我从未遇到过能完全听懂我说话的语音转文字应用,即便是Alexa和Siri这类AI助手也常无法准确响应指令。

相比科技巨头的听写技术,Wispr Flow带来了质的飞跃,初期使用时,我仍需在桌面端和移动端应用中进行语句修正,但数次使用后识别准确率显著提升,最终我完全依赖该应用撰写长篇邮件和信息,甚至本文大部分内容也通过纯语音输入完成。

该应用配备数字符号键盘以输入特殊字符,可自动学习用户自定义名称术语,也支持手动添加至词典,在需要保持安静的场合,用户甚至能对着麦克风耳语输入,公司宣称iOS版在弱网环境下仍可正常使用。

联合创始人塔奈·科塔里(Tanay Kothari)向TechCrunch透露,最初他们计划开发通过默读实现输入的可穿戴设备,其操作系统层正是Flow,去年七月公司转型聚焦软件开发,数月后便推出Mac版应用。

桌面端用户通过热键即可在任何应用中启动听写,操作极为便捷,而iOS版的挑战在于说服用户每次使用时切换至Wispr键盘。

Wispr Flow提供每周2000字的免费额度,87.24元人民币(12美元)/月或1046.88元人民币(144美元)/年的无限制套餐用户可优先体验新功能,该公司已从恩颐投资(NEA)、Palo Alto Networks及8VC等机构融资189,020,000元人民币(2600万美元),科塔里表示其订阅业务转化率达19%月营收正以60%的速度增长

该初创公司计划年内发布安卓应用,并正在开发面向企业的共享上下文功能,使应用能理解特定行业术语,尽管面临Y Combinator投资的Aqua、Talktastic、Superwhisper及Betterdication等竞争对手,科塔里认为随着AI与语音技术进步,市场竞争虽会加剧,但Wispr的工程师团队及长期技术投入将形成差异化优势。


文章标签: #语音输入 #人工智能 #初创企业 #iOS应用 #语音识别

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。