随着人工智能公司日渐成熟,对高质量数据的争夺已成为行业竞争最激烈的领域之一,催生出了梅科尔(Mercor)萨奇(Surge)以及最受瞩目的亚历山德尔·王(Alexandr Wang)创立的Scale AI等企业。如今已转战Meta负责人工智能业务,许多投资者看到了新的机遇——他们愿意资助那些拥有引人注目的训练数据收集新策略的公司。

Cover Image

毕业于Y Combinator孵化器的数据曲线(Datacurve)正是这样一家公司,专注于软件开发领域的高质量数据。本周四,该公司宣布完成1500万美元的A轮融资,本轮由切姆斯特里(Chemistry)基金的马克·戈德堡(Mark Goldberg)领投,DeepMindVercelAnthropicOpenAI的员工参与跟投。此次A轮融资之前,该公司曾获得270万美元的种子轮融资,吸引了Coinbase前首席技术官巴拉吉·斯里尼瓦桑(Balaji Srinivasan)的投资。

数据曲线采用“赏金猎人”制度,吸引技能娴熟的软件工程师完成最难获取的数据集构建。该公司为这些贡献提供报酬,截至目前已发放超过100万美元的赏金。

但联合创始人瑟琳娜·葛(图中与联合创始人查利·李合影)表示,最大的激励并非金钱。对于软件开发这类高价值服务,数据工作的报酬始终远低于传统就业——因此公司最核心的竞争优势在于打造积极的用户体验。

“我们将这视为消费品,而非数据标注业务,”表示,“我们投入大量时间思考:如何优化体验,让我们需要的人才感兴趣并加入我们的平台?”

这在后训练数据需求日趋复杂的背景下尤为重要。早期模型使用简单数据集进行训练,而当今的人工智能产品依赖复杂的强化学习环境,这些环境需要通过特定战略性的数据收集来构建。随着环境日益复杂,对数据量和质的要求都更为严苛——这一趋势可能让数据曲线这类高质量数据收集公司获得竞争优势。

作为早期初创企业,数据曲线目前专注于软件工程领域,但指出该模式同样适用于金融、营销乃至医疗等领域。

“我们正在构建一套后训练数据收集的基础设施,旨在吸引并留住各领域的高水平人才,”强调道。


文章标签: #人工智能 #数据收集 #融资 #软件开发 #初创企业

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。