谷歌DeepMind周二发布了名为“双子座机器人本地版”(Gemini Robotics On-Device)的新型语言模型,该模型可在机器人设备本地运行任务而无需联网。

Cover Image

该模型基于今年三月发布的初代双子座机器人模型开发,能直接控制机器人运动轨迹。开发者通过自然语言指令即可操控并微调模型,以适应多样化需求。

谷歌宣称在基准测试中,该模型性能接近云端版双子座机器人模型,且综合表现优于其他未具名的本地模型。

演示视频显示,搭载该本地模型的机器人能完成拉开背包拉链、折叠衣物等操作。虽然模型最初针对ALOHA机器人训练,但现已适配双臂弗兰卡FR3机器人(bi-arm Franka FR3)及Apptronik公司研发的阿波罗人形机器人(Apollo humanoid robot)。

谷歌特别强调,双臂弗兰卡FR3成功处理了未经“学习”的工业场景——如在传送带上完成装配任务。

同步发布的还有双子座机器人软件开发套件(SDK)。开发者可在MuJoCo物理模拟器中向机器人展示50至100次任务演示,通过这些模型训练机器人掌握新技能。

其他人工智能企业也在布局机器人领域:英伟达(Nvidia)正构建人形机器人基础模型平台;Hugging Face不仅开发机器人开源模型与数据集,同时推进实体机器人研发;韩国初创公司RLWRLD(获未来资产投资)则致力于创建机器人基础模型。


文章标签: #人工智能 #机器人 #谷歌 #语言模型 #工业应用

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。