A Mentee Robotics, com sede em Israel, demonstrou um fluxo de trabalho logístico: dois MenteeBot V3 humanoides trabalham autonomamente para pegar e colocar caixas. Um Sistema de Agentes Modular é preferido porque favorece a robustez no mundo real e menores necessidades computacionais em relação ao modelo End-to-End VLA. Sua arquitetura é composta por três componentes: - Planejador LLM: Converte instruções em código executável da Linguagem de API Robótica para decomposição de tarefas confiável e tratamento de erros. - Pilha de Percepção: Usa modelos pré-treinados (NeRF/3DGS, visão destilada) para compreensão de cena e navegação. - Políticas de Controle: Modelos de Aprendizado por Reforço (RL), treinados em larga escala via Sim2Real, geram comandos de motor, permitindo manipulação móvel de alta precisão. Crucialmente, o robô aprende novas tarefas a partir de uma única demonstração em horas. O rastreamento de objetos usa geometria 3D (STL/URDF) rastreada no vídeo para definir a função de recompensa do RL. O treinamento é otimizado usando 'Aprendizado de Currículo Automático', que ajusta autonomamente a dificuldade da tarefa com base no desempenho do robô, eliminando a engenharia manual. Todos os cálculos são realizados a bordo.
Especificações de hardware do MenteeBot V3
6,59K