Skild AI раскрывает свои карты (по крайней мере, частично). Данные телеприсутствия не разнообразны и ограничены временной шкалой 1:1 для человеческого оператора. Чтобы решить эту проблему, Skild предварительно обучила свою модель, используя видеоданные в масштабе интернета (уже широко доступные в виде видеозаписей с головной камеры от первого лица и миллионов обучающих видео на YouTube).
Используя этот обширный "биологический интеллект" в человеческих видео, модель может выполнять разнообразные задачи с менее чем одним часом данных, специфичных для роботов.
Этот подход преодолевает узкое место в данных робототехники, чтобы разблокировать масштаб моделей-фундаментов. Модель также устойчива к противодействующему вмешательству - такая прочность обычно наблюдается в локомоции.
64