如今,在家打造精密机器人项目变得稍微容易一些了。本周早些时候,人工智能开发平台Hugging Face发布了一款名为SmolVLA的开源机器人AI模型。该公司宣称,基于“兼容许可”的社区共享数据集训练的SmolVLA,在虚拟和现实环境中表现都优于许多大型机器人模型。

Hugging Face在博客中写道:“SmolVLA旨在普及视觉-语言-动作(VLA)模型的应用,加速通用机器人智能体的研究进程。它不仅是一个轻量级但功能强大的模型,更是一套训练和评估通用机器人技术的完整方法论。”
这款拥有4.5亿参数的模型,其训练数据来源于LeRobot社区数据集——这是Hugging Face平台上专门标注的机器人数据集。参数(有时称为“权重”)是决定模型行为的内在要素。该公司表示,SmolVLA体积小巧到能在普通消费级显卡甚至MacBook上运行,并可在包括其自有机器人系统在内的“经济型”硬件上进行测试部署。
值得玩味的是,SmolVLA还支持“异步推理架构”。据Hugging Face解释,这种设计能让模型将机器人的动作处理与视觉听觉处理分离,“正是这种分离,使得机器人在快速变化的环境中能更迅捷地作出反应”。
目前用户已可从Hugging Face平台下载SmolVLA。有推特用户声称已利用该模型成功操控第三方机械臂。
需要指出的是,Hugging Face并非开放机器人领域的唯一参与者。英伟达(Nvidia)拥有完整的开放机器人工具链,初创企业K-Scale Labs正在构建所谓“开源人形机器人”的核心组件。该领域其他重要参与者还包括Dyna Robotics、杰夫·贝索斯(Jeff Bezos)投资的Physical Intelligence以及RLWRLD等公司。



