.@RichardSSutton, som är fadern till förstärkningsinlärning, tycker inte att LLM:er är bittra lektioner. Min stålman i Richards position: vi behöver lite ny arkitektur för att möjliggöra kontinuerligt lärande (på jobbet). Och om vi har ett kontinuerligt lärande behöver vi inte en speciell träningsfas – agenten lär sig bara i farten – som alla människor, och faktiskt som alla djur. Detta nya paradigm kommer att göra vårt nuvarande tillvägagångssätt med LLM föråldrat. Jag gjorde mitt bästa för att representera åsikten att LLM:er kommer att fungera som grunden på vilken detta erfarenhetsbaserade lärande kan ske. Det slog gnistor. 0:00:00 - Är LLM en återvändsgränd? 0:13:51 – Gör människor imitationsinlärning? 0:23:57 - Erfarenhetens era 0:34:25 – Nuvarande arkitekturer generaliserar dåligt utanför distributionen 0:42:17 – Överraskningar inom AI-området 0:47:28 - Kommer The Bitter Lesson fortfarande att gälla efter AGI? 0:54:35 – Succession till AI
Leta upp Dwarkesh Podcast på YouTube, Apple Podcasts, Spotify, etc för att titta där och prenumerera på framtida avsnitt.
893,32K