在硬件方面取得了令人印象深刻的进展。 但要实现大规模采用,我们需要这些机器人首先处理“无聊”的事情——在混乱中保持可靠性。一个能做咖啡的机器人很酷。一个能在没有任何错误的情况下分类10,000个杂乱包裹的机器人才是有利可图的。真正的竞争在于VLA(视觉-语言-行动)模型的准确性。