Vi gjør roboter mer kapable enn noen gang i den fysiske verden. 🤖 Gemini Robotics 1.5 er et agentisk system som kan resonnere bedre, planlegge fremover, bruke digitale verktøy som @Google Search, samhandle med mennesker og mye mer. Slik fungerer 🧵 det
Mange av våre daglige aktiviteter tar mange skritt å fullføre og kan være ekstremt utfordrende for roboter. Tenk deg å spørre: "Basert på hvor jeg befinner meg, kan du sortere disse gjenstandene i riktig kompost, resirkulering og søppelbøtter?" 🗑️ Roboten må søke på nettet etter lokale retningslinjer, se på objektene, finne ut hvordan de skal sorteres og deretter fullføre oppgaven. ↓
For å takle disse forespørslene kan Gemini Robotics 1.5 drive nye agentapplikasjoner med to viktige AI-modeller som jobber sammen: 🔹Gemini Robotics-ER 1.5: Dette fungerer som hjernen på høyt nivå, samhandler med mennesker, forstår miljøet, orkestrerer verktøy og lager en detaljert plan for å utføre en oppgave. 🔹Gemini Robotics 1.5: Dette er ansvarlig for utførelse, og oversetter instruksjoner til presise motorkommandoer som trengs for at roboten skal bevege seg og handle på en generell måte.
Gemini Robotics-ER 1.5 er den første tenkemodellen som er optimalisert for kroppslig resonnement, og oppnår toppmoderne ytelse på akademiske og interne benchmarks. 🧠 Dens virkelige forståelse gjør den til en perfekt orkestrator på høyt nivå for roboter. Se hvordan den takler organisering av et travelt skrivebord ↓
Tradisjonelt oversetter VLA-modeller instruksjoner direkte til robotbevegelse. 🦾 Gemini Robotics 1.5 kan nå tenke før de handler, og generere en intern sekvens av resonnement ved hjelp av naturlig språk. Dette gjør robothandlingene mer tolkbare, og låser opp mer nyttige oppgaver - som å organisere klesvask etter farge. ↓
Hva skjer når du ber roboten om å «pakke en koffert for turen min til London»? 🧳 Den kan slå opp været, tenke på hva den skal pakke, hvor den skal få tak i og hvordan den skal pakkes. I denne prosessen kan modellen dele opp lange oppgaver i enklere og kunne tilpasses endringer i miljøet. ↓
Roboter kommer i alle former og størrelser, med forskjellige former, sensere og frihetsgrader. 💡 Gemini Robotics 1.5 kan lære på tvers av ulike utførelsesformer og kan overføre kunnskap lært fra en robot til en annen uten å måtte spesialisere seg.
Vi beveger oss nå utover modeller som reagerer på enkeltinstruksjoner og skaper systemer som virkelig kan takle problemer på en generell måte - på veien mot å løse AGI i den fysiske verden. Utviklere kan nå bruke Gemini Robotics-ER 1.5 via Gemini API i @GoogleAIStudio. Finn ut mer →
407,39K