Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, som är fadern till förstärkningsinlärning, tycker inte att LLM:er är bittra lektioner.
Min stålman i Richards position: vi behöver lite ny arkitektur för att möjliggöra kontinuerligt lärande (på jobbet).
Och om vi har ett kontinuerligt lärande behöver vi inte en speciell träningsfas – agenten lär sig bara i farten – som alla människor, och faktiskt som alla djur.
Detta nya paradigm kommer att göra vårt nuvarande tillvägagångssätt med LLM föråldrat.
Jag gjorde mitt bästa för att representera åsikten att LLM:er kommer att fungera som grunden på vilken detta erfarenhetsbaserade lärande kan ske. Det slog gnistor.
0:00:00 - Är LLM en återvändsgränd?
0:13:51 – Gör människor imitationsinlärning?
0:23:57 - Erfarenhetens era
0:34:25 – Nuvarande arkitekturer generaliserar dåligt utanför distributionen
0:42:17 – Överraskningar inom AI-området
0:47:28 - Kommer The Bitter Lesson fortfarande att gälla efter AGI?
0:54:35 – Succession till AI
Leta upp Dwarkesh Podcast på YouTube, Apple Podcasts, Spotify, etc för att titta där och prenumerera på framtida avsnitt.
893,32K
Topp
Rankning
Favoriter