Skild AI odkrywa swoje karty (przynajmniej częściowo). Dane teleoperacyjne brakuje różnorodności i są ograniczone przez czas skali 1:1 operatora ludzkiego. Aby to naprawić, Skild wstępnie wytrenował swój model, korzystając z danych wideo w skali internetowej (już szeroko dostępnych w postaci nagrań z kamery na głowie "egocentrycznych" oraz milionów instruktażowych filmów na YouTube).
Wykorzystując tę ogromną "inteligencję biologiczną" w ludzkich filmach, model może wykonywać różnorodne zadania przy mniej niż jednej godzinie danych specyficznych dla robota.
To podejście przełamuje wąskie gardło danych robotyki, aby odblokować skalę modelu podstawowego. Model również wytrzymuje zakłócenia adwersarialne - rodzaj odporności, który zazwyczaj obserwuje się w lokomocji.
45