Miksi robotit näyttävät tyhmiltä? Yhdistettynä äskettäin katsomaani fantasia-TV-sarjaan "Hirviöt eivät ole niin yksinkertaisia", ja sama pätee "Steel to Humaniin". Robotin kaksi tärkeintä osaa, mieli ja keho. Yksinkertaisesti sanottuna hänen tyhmyytensä on siinä, että ihmisenä olemisen korvikkeena hänen mielensä on hieman huonompi ja hänen ruumiinsa on myös hieman huonompi. Tässä artikkelissa puhutaan ensin ensimmäisestä puoliskosta, mielestä 🧠. Älykkääksi tuleminen vaatii valtavan määrän datakoulutusta. Robottien kielimalleja ovat sekä VLM (näkökielimalli) että LLM (suuri kielimalli). Miksi robotit tarvitsevat VLM:ää? Koska kielimalleilla ei ole silmiä, he voivat vain "ymmärtää", mutta eivät nähdä maailmaa. Jos esimerkiksi sanot "Auta minua poimimaan vesilasi pöydän vasemmalta puolelta", robotin on "nähtävä" toimiakseen. Pelkät visuaaliset mallit eivät riitä, ne tunnistavat esineitä, mutta eivät ymmärrä ihmisen kieltä ja aikomuksia. VLM = Aivojen ja silmän fuusio Ihmisen ohjeet (kieli) + ympäristöhavainto (visio) → yhdistetty toimintasuunnitelmiksi. Autonominen ajaminen, johon olemme nyt tottuneet, on itse asiassa VLM. Autonomisen ajamisen on vain opittava paljon vähemmän dataa. Loppujen lopuksi humanoidirobotit jäljittelevät ihmisiä, ja niiden sovellusskenaarioiden monimuotoisuus ja monimutkaisuus ovat seuraava ulottuvuus. VLM-koulutuksessa robotin tarvitseman datamäärän ja todellisen datamäärän välillä on edelleen valtava kuilu. Tärkeimmät tavat tuottaa näitä tietoja ovat "liikkeenkaappaus" ja "VR-etäkäyttö". Tämä tiedonkeruumenetelmä on erittäin kallis + tehoton, eikä toimitetun tiedon määrä riitä. Samanaikaisesti näistä erityisistä keräysmenetelmistä saaduista tiedoista puuttuu usein "yleistys". Robottikoulutus tapahtuu usein puhtaassa, valvotussa ympäristössä: pöydälle asetetaan muutama yleinen esine (pullot, kupit, palikat). Mutta todellisuudessa: kuppi voi olla läpikuultava, heijastava ja puoliksi paperipyyhkeen peitossa. Erilaiset häiriötekijät (sotku, melu, ihmiset kävelevät ympäriinsä) koti-/tehdasympäristössä. Koulutustiedoista puuttuu tämä "pitkähäntätilanne", joten kun ympäristö muuttuu, robotti on "tyhmä".
4,66K