人工智能公司的爆发式增长将算力需求推向新高,CoreWeaveTogether AILambda Labs等公司凭借提供分布式算力的能力抓住机遇,吸引了巨额关注与资本。

Cover Image

但绝大多数企业仍将数据存储于三大云服务商——AWS谷歌云微软Azure。这些巨头的存储系统设计初衷是将数据紧贴自有算力资源,而非分散在多个云平台或区域。

“现代AI工作负载与基础设施正选择分布式计算而非大云平台,”蒂格里斯数据公司(Tigris Data)联合创始人兼首席执行官奥维斯·塔里克(Ovais Tariq)向TechCrunch表示,“我们希望为存储提供同等选择,因为没有存储的算力毫无意义。”

由开发优步存储平台的团队创立的蒂格里斯,正在构建本地化数据存储中心网络,声称能满足现代AI工作负载的分布式算力需求。这家初创企业的AI原生存储平台“随算力动态迁移,支持数据自动复制至GPU所在位置,可处理数十亿小型文件,并为训练、推理及智能体工作负载提供低延迟访问,”塔里克介绍道。

为实现这些目标,TechCrunch独家获悉蒂格里斯近期完成2500万美元的A轮融资。本轮由Spark Capital领投,安德森·霍洛维茨(Andreessen Horowitz)等现有投资方跟投。这家初创企业正挑战被塔里克称为“大云”的行业巨头。

塔里克认为这些传统厂商不仅提供价格更昂贵的数据存储服务,效率也更为低下。AWS谷歌云微软Azure长期向需要迁移至其他云服务商,或希望使用更廉价GPU、在全球多地同步训练模型时下载转移数据的客户收取流出费用(业内称为“云税”)。这好比终止健身会员资格时还需向健身房支付额外费用。

蒂格里斯客户Fal.ai工程负责人巴图汉·塔斯卡亚(Batuhan Taskaya)透露,这类费用曾占其云支出的绝大部分。

除流出费用外,塔里克指出大型云服务商仍存在延迟问题。“流出费用只是深层病症的表征:集中式存储无法适应去中心化的高速AI生态系统,”他表示。

蒂格里斯4000余家企业客户中多数与Fal.ai类似,均是开发图像、视频及语音模型的生成式AI初创企业,这些企业通常拥有庞大且对延迟敏感的数据集。

“设想与处理本地音频的AI智能体对话时,你需要最低延迟。不仅要求算力本地化,存储同样需要就近部署,”塔里克解释道。

他补充道,大型云平台并未针对AI工作负载优化。流式传输海量数据集进行训练或多地域实时推理可能引发延迟瓶颈,拖慢模型性能。而接入本地化存储意味着更快的数据检索速度,使开发者能借助去中心化云服务更可靠、更经济地运行AI工作负载。

蒂格里斯通过在所有云端提供统一数据文件系统访问,让我们无需支付流出费用即可扩展任意云平台的工作负载,”Fal.ai塔斯卡亚表示。

企业选择让数据贴近分布式云方案还存在其他动因。例如在金融、医疗等高监管强度领域,采用AI工具的主要障碍在于企业需确保数据安全。

塔里克指出另一动机是企业对数据自主权日益重视,并提及赛富时(Salesforce)今年初禁止AI竞争对手使用Slack数据的案例。“企业愈发意识到数据的核心价值——如何驱动大语言模型与AI系统。他们希望加强控制权,而非交由他人掌控。”

获得新资金后,蒂格里斯计划继续建设数据存储中心以满足增长需求——塔里克透露这家2021年11月成立的初创企业年均增速达8倍。目前已在弗吉尼亚州芝加哥圣何塞设立三处数据中心,并计划持续拓展美国、欧洲及亚洲市场,重点布局伦敦法兰克福新加坡


文章标签: #人工智能 #云计算 #数据存储 #初创企业 #融资

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。