.@RichardSSutton, vahvistusoppimisen isä, ei usko, että LLM:t ovat katkeria oppitunteja. Richardin teräsmies: tarvitsemme uutta arkkitehtuuria, joka mahdollistaa jatkuvan (työssä) oppimisen. Ja jos meillä on jatkuvaa oppimista, emme tarvitse erityistä koulutusvaihetta - agentti vain oppii lennossa - kuten kaikki ihmiset ja todellakin, kuten kaikki eläimet. Tämä uusi paradigma tekee nykyisestä lähestymistavastamme LLM:ien suhteen vanhentuneen. Tein parhaani edustaakseni näkemystä, jonka mukaan LLM:t toimivat perustana, jolle tämä kokemuksellinen oppiminen voi tapahtua. Jotkut kipinät lensivät. 0:00:00 – Ovatko LLM:t umpikuja? 0:13:51 – Tekevätkö ihmiset jäljittelyoppimista? 0:23:57 – Kokemuksen aikakausi 0:34:25 – Nykyiset arkkitehtuurit yleistyvät huonosti ulos jakelusta 0:42:17 – Yllätyksiä tekoälyalalla 0:47:28 – Päteekö katkera oppitunti edelleen AGI:n jälkeen? 0:54:35 – Tekoälyn perimys
Etsi Dwarkesh Podcast YouTubesta, Apple Podcastsista, Spotifysta jne.
464,76K