目前许多人工智能工具都能观看视频并总结内容,但当涉及跨越多小时的多段视频素材提问时,模型就会遇到挑战。

这对于希望通过AI筛查数千小时不同监控画面的安防公司,以及需要研究各类视频广告和产品拍摄的营销企业而言,形成了重大制约。Memories.ai正试图通过其能处理1000万小时视频的AI平台解决该问题。这家初创企业旨在为拥有海量视频分析需求的公司提供包含可搜索索引、标签、片段和聚合功能的情境理解层

Cover Image

联合创始人沈肖恩博士(Dr. Shawn Shen)在攻读博士学位期间曾担任Meta现实实验室(Meta’s Reality Labs)的研究科学家,另一位创始人周恩民(Enmin Zhou)则曾任Meta机器学习工程师。

谷歌OpenAIMeta等顶尖AI企业都专注于开发端到端模型。虽然这些模型性能优异,但对超过一两小时的视频情境理解仍存在局限,”沈肖恩向TechCrunch表示,“人类运用视觉记忆时会筛选大量情境数据。受此启发,我们希望构建能更好理解超长视频的解决方案。”

为实现这一目标,该公司近日完成由Susa Ventures领投的800万美元种子轮融资,参投方包括三星Next(Samsung Next)、Fusion FundCrane VenturesSeedcampCreator Ventures。沈肖恩透露,公司原计划融资400万美元,但因投资者热情最终获得超额认购。

“肖恩是位技术底蕴深厚的创始人,执着于突破视频理解与智能的边界,”Susa Ventures合伙人米莎·戈登-罗威(Misha Gordon-Rowe)评价道,“Memories.ai的解决方案能释放大量第一方视觉智能数据。我们认为长时视觉智能存在市场空白,这吸引了我们投资。”

三星Next则持不同视角——这家三星集团投资机构看好该技术对消费者的价值。“Memories.ai的亮点在于强大的终端计算能力,这意味着用户不必将视频数据存储在云端,”其合伙人山姆·坎贝尔(Sam Campbell)指出,“这能为担心隐私泄露而不愿安装家庭监控的人士提供更安全的解决方案。”

Memories.ai表示采用自研技术栈和模型进行分析:先对视频降噪,经压缩层处理后仅存储关键数据;再通过索引层实现支持自然语言查询的视频分段标记检索;聚合层则对索引数据汇总生成报告。

目前该平台主要服务两类客户:营销公司可用其分析社交媒体品牌趋势并确定视频创作方向,安防企业则能通过行为模式推理识别监控画面中的潜在危险动作。现阶段客户需上传视频库至平台分析,但沈肖恩表示未来将支持创建共享驱动器实现内容同步,最终实现“告诉我上周所有面试者信息”这类智能查询。

沈肖恩展望未来:AI助手可通过用户照片或智能眼镜获取生活情境;该技术还能训练人形机器人执行复杂任务,或帮助自动驾驶汽车记忆不同路线。公司现有15名员工,计划将资金用于团队扩建和搜索功能优化。

尽管面临mem0Letta等提供AI记忆层(目前视频支持有限)的初创企业,以及专注视频理解的Twelve Labs谷歌等公司的竞争,沈肖恩认为其解决方案更具横向兼容性,可适配不同视频模型。


文章标签: #人工智能 #视频分析 #安防 #营销 #融资

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。