人工智能语音助手和自动驾驶汽车有什么共同点?前Waymo技术主管布鲁克·霍普金斯认为,它们的性能可以用相同的方法来评估。霍普金斯创立的新公司Coval,正是基于这一理念,致力于开发一种全新的测试平台。
霍普金斯在离开Waymo后发现,他们在Waymo遇到的很多技术难题,其实也是整个AI行业普遍面临的问题。但当时很多人都觉得这是一个全新的领域,需要从头开始摸索测试方法,仿佛一切都要重新发明。霍普金斯却觉得,他们在自动驾驶领域已经积累了10年的经验,完全可以借鉴到语音助手的测试中。
2024年,霍普金斯决定创立Coval。这是一个为AI语音和聊天助手构建模拟环境的平台,通过模拟真实场景来测试这些助手在执行任务时的表现。比如让助手去预订餐厅,或者回答一些比较绕弯子的客户问题。Coval可以同时运行数千次这样的模拟测试,效率非常高。
Coval的测试技术基于一组通用指标,但企业也可以根据自身需求进行定制化。它不仅可以检测助手的性能,还能持续监控是否存在退化问题。用户可以利用这些测试数据和分析结果,向最终客户展示助手的性能,无论是用于产品演示,还是作为监控工具,都能让客户清楚地看到助手是否按预期工作。
霍普金斯表示,企业对AI助手的最大顾虑之一就是担心这些产品只是看起来很厉害,但实际效果并不理想。对于企业高管来说,选择合适的供应商非常困难,因为他们不知道该问什么问题,也不知道如何验证这些助手是否真的能达到预期效果。而Coval的出现,正好解决了这一难题,帮助企业真正展示和证明AI助手的实际能力。
Coval的想法是在2024年Y Combinator夏季孵化项目中初步形成的,并于2024年10月正式对外发布。霍普金斯说,市场对Coval的需求一直很强劲,尤其是在过去两个月,需求增长迅猛,很多客户都迫不及待地想让Coval来评估他们的AI助手。
这家总部位于旧金山的初创公司最近宣布完成了一轮330万美元的种子轮融资,由MaC Venture Capital领投,Y Combinator和General Catalyst参与。公司计划利用这笔资金扩充工程团队,并进一步完善产品,以更好地满足市场需求。霍普金斯还透露,未来Coval还将拓展业务,支持对其他类型的AI助手进行评估,比如基于网络的助手。
目前,AI助手行业正处于高速发展期,相关的炒作和关注度也达到了前所未有的高度。像Salesforce的马克·贝尼奥夫这样的企业技术领导者,都在大力推广AI助手技术,并声称Salesforce将在明年部署超过10亿个AI助手。此外,还有传言称OpenAI也将很快发布自己的AI助手产品。
在这一领域,众多初创公司如雨后春笋般涌现。仅2024年,Y Combinator的三批孵化项目中就有超过100家初创公司专注于开发AI助手。其中一些公司还获得了大笔风险投资。例如,/dev/agents在成立不到一年后,就在2024年11月完成了5500万美元的种子轮融资,估值高达5亿美元。
随着AI助手行业的快速发展,未来肯定会有越来越多的企业需要专业的评估工具来测试他们的产品。霍普金斯认为,Coval在竞争中已经占据了先机。她表示:“我在这一领域已经工作了五年,多次构建过类似的系统。我们经历了多次迭代,见证了它们的成功与失败,也看到了它们如何扩展。这些经验都被融入到了Coval中,让我们在行业中更具竞争力。”