以色列的 Mentee Robotics 展示了一种物流工作流程:两个 MenteeBot V3 人形机器人自主工作,进行物品的拾取和放置。 模块化代理系统更受欢迎,因为它在现实世界的鲁棒性和较低的计算需求上优于端到端 VLA 模型。其架构由三个组件组成: - LLM 规划器:将指令转换为可执行的机器人 API 语言代码,以实现可靠的任务分解和错误处理。 - 感知堆栈:使用预训练模型(NeRF/3DGS,蒸馏视觉)进行场景理解和导航。 - 控制策略:通过 Sim2Real 大规模训练的强化学习(RL)模型生成电机指令,实现高精度的移动操作。 关键是,机器人可以在几个小时内通过单次演示学习新任务。物体跟踪使用视频中跟踪的 3D 几何(STL/URDF)来定义 RL 奖励函数。 训练通过“自动课程学习”进行优化,该方法根据机器人性能自动调整任务难度,消除了手动工程。所有计算均在机载运行。
MenteeBot V3 硬件规格
8.81K