A Mentee Robotics, sediada em Israel, demonstrou um fluxo de trabalho logístico: dois humanoides MenteeBot V3 trabalham de forma autônoma para escolher e colocar as caixas. Um Sistema Modular de Agentes é preferido porque favorece a robustez do mundo real e menores necessidades de computação em relação ao modelo VLA de ponta a ponta. Sua arquitetura é composta por três componentes: - LLM Planner: Converte instruções em código executável da Robotic API Language para decomposição confiável de tarefas e tratamento de erros. - Perception Stack: Utiliza modelos pré-treinados (NeRF/3DGS, visão destilada) para compreensão e navegação de cenas. - Políticas de Controle: Modelos de Aprendizado por Reforço (RL), treinados em escala via Sim2Real, geram comandos motores, permitindo manipulação móvel de alta precisão. Crucialmente, o robô aprende novas tarefas em uma única demonstração em horas. O rastreamento de objetos utiliza geometria 3D (STL/URDF) rastreada no vídeo para definir a função de recompensa RL. O treinamento é otimizado usando o 'Aprendizado Automático do Currículo', que ajusta autonomamente a dificuldade da tarefa com base no desempenho do robô, eliminando a engenharia manual. Todo o cálculo roda a bordo.
Especificações de hardware do MenteeBot V3
6,59K