Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, ojciec uczenia przez wzmocnienie, nie sądzi, że LLM-y są napakowane gorzką lekcją.
Mój mocny argument za stanowiskiem Richarda: potrzebujemy nowej architektury, aby umożliwić ciągłe (w trakcie pracy) uczenie się.
A jeśli mamy ciągłe uczenie się, nie potrzebujemy specjalnej fazy treningowej - agent uczy się na bieżąco - jak wszyscy ludzie, a w rzeczy samej, jak wszystkie zwierzęta.
Ten nowy paradygmat sprawi, że nasze obecne podejście do LLM-ów stanie się przestarzałe.
Starałem się jak najlepiej przedstawić pogląd, że LLM-y będą funkcjonować jako fundament, na którym może zachodzić to doświadczeniowe uczenie się. Niektóre iskry poleciały.
0:00:00 – Czy LLM-y to ślepy zaułek?
0:13:51 – Czy ludzie uczą się przez naśladowanie?
0:23:57 – Era doświadczenia
0:34:25 – Obecne architektury słabo generalizują poza dystrybucję
0:42:17 – Niespodzianki w dziedzinie AI
0:47:28 – Czy gorzka lekcja nadal będzie miała zastosowanie po AGI?
0:54:35 – Sukcesja do AI
Szukaj podcastu Dwarkesh na YouTube, Apple Podcasts, Spotify itp., aby go oglądać i subskrybować przyszłe odcinki.
1,18M
Najlepsze
Ranking
Ulubione