Myślę, że część winy leży w kulturze startupów w Dolinie Krzemowej / SF, która nagradza rozwój AI wrappers i dostosowywanie istniejących modeli AI. W połączeniu z mantrą „buduj szybko, łam zasady”, która zniechęca do „poświęcania czasu na naukę rzeczy / naukę podstaw”. W istocie, istnieje duża presja kulturowa na młodych badaczy i przedsiębiorców (żyjących na zachodnim wybrzeżu), aby natychmiast dostarczyć coś i być na bieżąco z trendami, aby wyróżnić się wśród swoich rówieśników lub mieć startup, który można sfinansować. Oznacza to, że większość osób nigdy nie ma szansy na naukę lub eksplorację podstaw i po prostu buduje na istniejących badaniach lub produktach. W kontekście World Models chodzi po prostu o możliwość uruchamiania badań / modeli związanych z Gaussian splat, zamiast fundamentalnego zrozumienia, jak działa wizja 3D lub nawet grafika komputerowa. W kontekście embodied AI uważam, że jest jeszcze gorzej. Aby to wyjaśnić, znacznie łatwiej jest uruchomić istniejący model VLA i dostosować ramię robota do podnoszenia kubka, niż spędzić kilka dni na przykład na zrozumieniu ograniczeń klasycznego planowania ruchu, chwytania, manipulacji, kinematyki odwrotnej itd. I mówię, że „jest gorzej”, ponieważ w embodied AI nie tylko zajmujesz się oprogramowaniem, ale także fizycznym systemem, a opanowanie rozwoju lub optymalizacji systemu sprzętowego / programowego to zupełnie inna sprawa.