周三,Meta公司发布了全新V-JEPA 2人工智能模型。这款“世界模型”旨在帮助AI智能体理解周围环境,是去年发布的V-JEPA模型的升级版本。该模型通过超过100万小时的视频数据进行训练,这些数据将助力机器人或其他AI智能体在物理世界中运作,理解并预测重力等概念如何影响事件发展的连续性。

Cover Image

这种因果关联的认知能力,与幼儿和动物在脑部发育过程中形成的常识判断类似。比如当你与小狗玩接球游戏时,它能够(理想情况下)理解皮球撞击地面后的反弹轨迹,或是预判落点位置而非盲目追逐当前球体位置。

Meta展示了多个应用场景:比如机器人视角下,当它手持餐盘和铲子走向盛有煎蛋的炉灶时,AI能准确预测下一步动作应该是用铲子将煎蛋转移到餐盘中。据Meta透露,V-JEPA 2的处理速度比英伟达(Nvidia)的Cosmos模型快30倍——后者同样致力于提升物理世界相关智能。不过两家公司可能采用了不同的基准测试体系。

“我们相信世界模型将开启机器人技术的新纪元,”Meta首席AI科学家杨立昆(Yann LeCun)在视频中阐述道,“让现实世界的AI助手能够处理家务和体力劳动,而不再需要海量的机器人训练数据。”


文章标签: #人工智能 #Meta #机器人 #世界模型 #AI训练

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。