苹果公司(Apple)的最新研究论文指出,结合人类指导者与机器人示范者的“PH2D”混合训练模式能显著提升人形机器人的训练效果。这项发表于公司公布Matrix3D和StreamBridge AI模型一周后的研究,标志着这家iPhone制造商在机器人领域的新突破。
这份题为《人形策略~人类策略》的论文系统分析了传统机器人训练方法的局限性,提出了一种兼具扩展性和成本效益的创新解决方案。研究团队摒弃了传统依赖机器人示范者的高成本模式——该模式不仅需要昂贵的人工遥控数据采集,还存在效率瓶颈。
苹果的创新方法在于将人类指导者纳入训练闭环。通过改装消费级设备,研究人员成功降低了训练成本:改造版Apple Vision Pro仅启用左下摄像头进行视觉捕捉,配合ARKit获取3D头部与手部定位数据;同时采用加装迷你ZED立体相机的Meta Quest头显,构建出经济高效的训练系统。
在具体实施中,人类指导者需保持标准坐姿完成抓取物体、倾倒液体等精细动作,系统同步记录动作画面与语音指令。经降速处理的影像资料最终转化为训练素材。苹果为此开发了能同时处理人类与机器人示范数据的“HAT”(人机动作转换器)模型,其处理的混合数据流被命名为“PH2D”(物理人机交互数据)。
研究数据显示,这种混合训练策略在特定任务(如垂直物体抓取)中展现出显著优势。相比纯机器人示范训练,采用PH2D模式的系统在泛化能力和鲁棒性方面提升明显。论文特别指出:“改装消费设备获取的人类示范数据,与机器人数据共同构成了可泛化的策略框架。”
虽然目前苹果仅公开展示过机器人台灯原型,但业内消息称其正在开发面向家庭场景的移动机器人。这项突破性训练技术很可能应用于未来产品,为人形机器人执行日常家务等任务提供技术支持。研究团队强调,该方法在降低90%训练成本的同时,实现了比传统方式更优的动作完成度。