在硬體方面取得了令人印象深刻的進展。 但要實現大規模採用,我們需要這些機器人首先處理「無聊」的工作——在混亂中保持可靠性。一個能泡咖啡的機器人很酷。一個能在沒有任何錯誤的情況下整理 10,000 個雜亂包裹的機器人才是有利可圖的。真正的競賽在於 VLA(視覺-語言-行動)模型的準確性。