Teemme roboteista tehokkaampia kuin koskaan fyysisessä maailmassa. 🤖 Gemini Robotics 1.5 on tasoitettu agenttijärjestelmä, joka pystyy päättelemään paremmin, suunnittelemaan etukäteen, käyttämään digitaalisia työkaluja, kuten @Google Searchia, olemaan vuorovaikutuksessa ihmisten kanssa ja paljon muuta. Näin se toimii 🧵
Monet päivittäisistä toiminnoistamme vaativat monia vaiheita, ja ne voivat olla erittäin haastavia roboteille. Kuvittele kysyväsi: "Voitko lajitella nämä esineet sijaintini perusteella oikeisiin komposti-, kierrätys- ja roska-astioihin?" 🗑️ Robotin on etsittävä verkosta paikallisia ohjeita, tarkasteltava esineitä, selvitettävä, miten ne lajitellaan, ja suoritettava sitten tehtävä. ↓
Näihin pyyntöihin vastaamiseksi Gemini Robotics 1.5 voi tehostaa uusia agenttisia sovelluksia kahdella keskeisellä tekoälymallilla, jotka toimivat yhdessä: 🔹Gemini Robotics-ER 1.5: Tämä toimii korkean tason aivoina, jotka ovat vuorovaikutuksessa ihmisten kanssa, ymmärtävät ympäristöään, orkestroivat työkaluja ja laativat yksityiskohtaisen suunnitelman tehtävän suorittamiseksi. 🔹Gemini Robotics 1.5: Tämä vastaa suorituksesta ja kääntää ohjeet tarkoiksi motorisiksi komennoiksi, joita robotti tarvitsee liikkuakseen ja toimiakseen yleisellä tavalla.
Gemini Robotics-ER 1.5 on ensimmäinen ajattelumalli, joka on optimoitu keholliseen päättelyyn, ja se saavuttaa huippuluokan suorituskyvyn akateemisissa ja sisäisissä vertailuarvoissa. 🧠 Sen reaalimaailman ymmärrys tekee siitä täydellisen korkean tason orkestraattorin roboteille. Katso, miten se käsittelee kiireisen työpöydän järjestämistä ↓
Perinteisesti VLA-mallit kääntävät käskyt suoraan robottiliikkeeksi. 🦾 Gemini Robotics 1.5 voi nyt ajatella ennen kuin ryhtyy toimiin ja luoda sisäisen päättelysarjan luonnollisen kielen avulla. Tämä tekee robotin toiminnoista helpommin tulkittavissa ja avaa hyödyllisempiä tehtäviä - kuten pyykin järjestämisen värin mukaan. ↓
Mitä tapahtuu, kun käsket robottia "pakkaamaan matkalaukun Lontoon matkalleni"? 🧳 Se voi etsiä säätä, miettiä, mitä pakata, mistä saada ja miten pakata. Tässä prosessissa malli voi pilkkoa pitkät tehtävät yksinkertaisempiin ja mukautua ympäristönsä muutoksiin. ↓
Robotteja on kaikenmuotoisia ja -kokoisia, ja niillä on erilaisia muotoja, aistimia ja vapausasteita. 💡 Gemini Robotics 1.5 voi oppia eri suoritusmuodoissa ja siirtää robotilta toiselle opittua tietoa ilman erikoistumista.
Siirrymme nyt yksittäisiin ohjeisiin reagoivien mallien ulkopuolelle ja luomme järjestelmiä, jotka voivat todella ratkaista ongelmia yleisellä tavalla - matkalla kohti AGI:n ratkaisemista fyysisessä maailmassa. Kehittäjät voivat nyt käyttää Gemini Robotics-ER 1.5:tä Gemini API:n kautta @GoogleAIStudio. Lue lisää →
407,42K