Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, vahvistusoppimisen isä, ei usko, että LLM:t ovat katkeria oppitunteja.
Richardin teräsmies: tarvitsemme uutta arkkitehtuuria, joka mahdollistaa jatkuvan (työssä) oppimisen.
Ja jos meillä on jatkuvaa oppimista, emme tarvitse erityistä koulutusvaihetta - agentti vain oppii lennossa - kuten kaikki ihmiset ja todellakin, kuten kaikki eläimet.
Tämä uusi paradigma tekee nykyisestä lähestymistavastamme LLM:ien suhteen vanhentuneen.
Tein parhaani edustaakseni näkemystä, jonka mukaan LLM:t toimivat perustana, jolle tämä kokemuksellinen oppiminen voi tapahtua. Jotkut kipinät lensivät.
0:00:00 – Ovatko LLM:t umpikuja?
0:13:51 – Tekevätkö ihmiset jäljittelyoppimista?
0:23:57 – Kokemuksen aikakausi
0:34:25 – Nykyiset arkkitehtuurit yleistyvät huonosti ulos jakelusta
0:42:17 – Yllätyksiä tekoälyalalla
0:47:28 – Päteekö katkera oppitunti edelleen AGI:n jälkeen?
0:54:35 – Tekoälyn perimys
Etsi Dwarkesh Podcast YouTubesta, Apple Podcastsista, Spotifysta jne.
464,76K
Johtavat
Rankkaus
Suosikit