Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
De ce roboții par proști? Combinat cu serialul TV fantasy pe care l-am urmărit recent, "Monștrii nu sunt atât de simpli", și același lucru este valabil și pentru "Steel to Human".
Cele mai importante două părți ale unui robot, mintea și corpul. Pur și simplu, prostia lui este că, în ceea ce privește a fi un substitut pentru a fi o persoană, mintea lui este puțin mai rea, iar corpul său este, de asemenea, puțin mai rău. Acest articol vorbește mai întâi despre prima jumătate, mintea 🧠.
Cum să devii inteligent necesită o cantitate uriașă de antrenament de date. Modelele de limbaj ale roboților includ atât VLM (model de limbaj vizual), cât și LLM (model de limbaj mare).
De ce roboții au nevoie de VLM? Deoarece modelele lingvistice nu au ochi, ele pot doar "înțelege", dar nu pot vedea lumea. De exemplu, dacă spui "Ajută-mă să ridic paharul de apă din partea stângă a mesei", robotul trebuie să "vadă" pentru a acționa. Modelele vizuale singure nu sunt suficiente, pot recunoaște obiecte, dar nu înțeleg limbajul și intențiile umane.
VLM = Fuziunea creierului și ochiului
Instrucțiunile umane (limbaj) + percepția mediului (viziune) → unificate în planuri de acțiune.
Conducerea autonomă cu care suntem obișnuiți acum este de fapt VLM. Doar că conducerea autonomă trebuie să învețe mult mai puține date. La urma urmei, roboții umanoizi imită oamenii, iar diversitatea și complexitatea scenariilor lor de aplicare sunt următoarea dimensiune.
În antrenamentul VLM, există încă un decalaj uriaș între cantitatea de date cerută de robot și cantitatea reală de date. Principalele modalități de generare a acestor date sunt "captura de mișcare" și "operarea de la distanță VR". Această metodă de colectare a datelor este extrem de costisitoare + ineficientă, iar cantitatea de date contribuite nu este suficientă.
În același timp, aceste date din metode speciale de colectare sunt adesea lipsite de "generalizare". Antrenamentul robotizat se face adesea într-un mediu curat și controlat: câteva obiecte comune (sticle, căni, blocuri) sunt așezate pe masă. Dar în realitate: ceașca poate fi translucidă, reflectorizandă și pe jumătate blocată de un prosop de hârtie. Diverse distrageri (dezordine, zgomot, oameni care se plimbă) în mediul casei/fabricii. Datele de antrenament nu au această "situație cu coadă lungă", așa că odată ce mediul se schimbă, robotul este "prost".
4,65K
Limită superioară
Clasament
Favorite