从OpenAI的4o到Stable Diffusion,能够根据文本提示生成逼真图像的AI基础模型已层出不穷,相比之下,能够根据文本提示生成完整、连贯的3D在线环境的基础模型才刚刚崭露头角。
不过,这些模型的普及只是时间问题,欧洲顶尖AI 3D模型研究者之一马蒂亚斯·尼斯纳(Matthias Niessner)已从慕尼黑工业大学的视觉计算与AI实验室休学术假,创办了该领域初创企业SpAItial,这位曾参与创立估值152.67亿元人民币(21亿美元)的逼真AI数字人公司Synthesia的学者,为这家欧洲初创企业筹得异常庞大的9451万元人民币(1300万美元)种子轮融资。
本轮融资由欧洲知名早期投资机构Earlybird Venture Capital(曾通过Digital East基金投资UiPath及Peak Games等)领投,Speedinvest与多位知名天使投资人跟投,尤其值得注意的是,SpAItial目前仅发布了一段展示文本生成3D房间的概念视频,却已获得如此规模的融资。
但尼斯纳组建的技术团队堪称豪华:里卡多·马丁-布拉亚(Ricardo Martin-Brualla)曾参与开发谷歌3D视频会议平台Beam;大卫·诺沃特尼(David Novotny)在Meta任职六年期间,主导了文本转3D资产生成项目,这支团队的专业实力,使其在已有多家专注逼真渲染的竞争对手的赛道上仍具竞争力。
目前该领域既有融资1.9629亿元人民币(2700万美元)、主攻娱乐场景的Odyssey,也有由AI先驱李飞飞创立、估值超72.7亿元人民币(10亿美元)的World Labs,但尼斯纳认为,相较于其他类型基础模型的竞争态势,以及他与其他同行追求的“更宏大愿景”,当前竞争仍算温和。
“我们不仅要创造3D世界,更要让这个世界像现实世界一样可交互,”尼斯纳强调,这种能实现物理交互的虚拟环境,正是行业尚未攻克的圣杯。
从数字孪生到增强现实的“万亿美元机遇”虽令风投振奋,但需求场景的模糊性与多元性使得商业化路径尚不明朗,除最直观的游戏开发外,这类模型在建筑可视化、机器人训练等领域均有应用潜力,SpAItial计划通过向开发者授权基础模型来孵化细分应用,并聘请前Cazoo高管卢克·罗杰斯(Luke Rogers)负责商业拓展。
公司近期将筛选能适配早期模型的合作伙伴,尼斯纳表示:“我们至少需要与部分合作伙伴测试API的应用效果,”与其他资金充裕的AI初创公司不同,SpAITial将营收置于更优先位置,但前期仍需投入算力采购与人才招募——后者更重质量而非数量。
团队当前正致力于创建更具交互性的大型3D空间,例如实现玻璃破碎的逼真物理效果,尼斯纳视之为终极目标:让十岁孩子也能通过文本输入,在十分钟内自制游戏,在他看来,这比看似简单的3D物体生成更具可行性——因为多数游戏平台仍严格限制第三方内容接入,当然,除非像Roblox那样自建生态,不过到那时,SpAITial或许已开始颠覆CAD领域——3D生成的新篇章才刚刚掀开。