Izraelska firma Mentee Robotics zaprezentowała workflow logistyczny: dwa humanoidy MenteeBot V3 pracują autonomicznie, aby podnosić i umieszczać pojemniki. Preferowany jest Modular Agent System, ponieważ sprzyja on odporności w rzeczywistym świecie i niższym wymaganiom obliczeniowym w porównaniu do modelu End-to-End VLA. Jego architektura składa się z trzech komponentów: - LLM Planner: Przekształca instrukcje w wykonywalny kod Robotic API Language, zapewniając niezawodne rozkładanie zadań i obsługę błędów. - Perception Stack: Wykorzystuje modele wstępnie wytrenowane (NeRF/3DGS, destylowana wizja) do rozumienia sceny i nawigacji. - Control Policies: Modele uczenia przez wzmocnienie (RL), trenowane na dużą skalę za pomocą Sim2Real, generują polecenia silnikowe, umożliwiając precyzyjną manipulację mobilną. Kluczowe jest to, że robot uczy się nowych zadań z jednego pokazu w ciągu kilku godzin. Śledzenie obiektów wykorzystuje geometrię 3D (STL/URDF) śledzoną w wideo do definiowania funkcji nagrody RL. Trening jest optymalizowany za pomocą 'Automatic Curriculum Learning', które autonomicznie dostosowuje trudność zadań w zależności od wydajności robota, eliminując ręczne inżynierowanie. Wszystkie obliczenia odbywają się na pokładzie.
Specyfikacje sprzętowe MenteeBot V3
8,81K