.@RichardSSutton, ojciec uczenia przez wzmocnienie, nie sądzi, że LLM-y są napakowane gorzką lekcją. Mój mocny argument za stanowiskiem Richarda: potrzebujemy nowej architektury, aby umożliwić ciągłe (w trakcie pracy) uczenie się. A jeśli mamy ciągłe uczenie się, nie potrzebujemy specjalnej fazy treningowej - agent uczy się na bieżąco - jak wszyscy ludzie, a w rzeczy samej, jak wszystkie zwierzęta. Ten nowy paradygmat sprawi, że nasze obecne podejście do LLM-ów stanie się przestarzałe. Starałem się jak najlepiej przedstawić pogląd, że LLM-y będą funkcjonować jako fundament, na którym może zachodzić to doświadczeniowe uczenie się. Niektóre iskry poleciały. 0:00:00 – Czy LLM-y to ślepy zaułek? 0:13:51 – Czy ludzie uczą się przez naśladowanie? 0:23:57 – Era doświadczenia 0:34:25 – Obecne architektury słabo generalizują poza dystrybucję 0:42:17 – Niespodzianki w dziedzinie AI 0:47:28 – Czy gorzka lekcja nadal będzie miała zastosowanie po AGI? 0:54:35 – Sukcesja do AI
Szukaj podcastu Dwarkesh na YouTube, Apple Podcasts, Spotify itp., aby go oglądać i subskrybować przyszłe odcinki.
1,18M