イスラエルに拠点を置くMentee Roboticsは物流ワークフローを実証しました。2体のMenteeBot V3ヒューマノイドが自律的にトートを選び、配置します。 モジュラーエージェントシステムは、エンドツーエンドVLAモデルよりも現実世界の堅牢性と計算需要の低さを優先するため、好まれます。その建築は三つの要素で構成されています。 - LLM プランナー:命令を実行可能なロボットAPI言語コードに変換し、信頼性の高いタスク分解とエラー処理を実現します。 - 知覚スタック:シーンの理解とナビゲーションのために事前学習済みモデル(NeRF/3DGS、ディスティリッドビジョン)を使用します。 - 制御ポリシー:Sim2Realで大規模に訓練された強化学習(RL)モデルが運動指令を生成し、高精度なモバイル操作を可能にします。 重要なのは、ロボットが1回のデモンストレーションから数時間で新しいタスクを習得できることです。オブジェクトトラッキングは、動画内で追跡された3Dジオメトリ(STL/URDF)を使って強化学習報酬関数を定義します。 トレーニングは「自動カリキュラム学習」を用いて最適化されており、ロボットのパフォーマンスに基づいてタスク難易度を自律的に調整し、手動のエンジニアリングを排除しています。すべての計算は船内で実行されます。
MenteeBot V3 ハードウェアスペック
5.6K