Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, bapak pembelajaran penguatan, tidak berpikir LLM adalah pil pelajaran pahit.
Pria baja saya dari posisi Richard: kita membutuhkan beberapa arsitektur baru untuk memungkinkan pembelajaran berkelanjutan (di tempat kerja).
Dan jika kita memiliki pembelajaran berkelanjutan, kita tidak memerlukan fase pelatihan khusus - agen hanya belajar dengan cepat - seperti semua manusia, dan memang, seperti semua hewan.
Paradigma baru ini akan membuat pendekatan kita saat ini dengan LLM menjadi usang.
Saya melakukan yang terbaik untuk mewakili pandangan bahwa LLM akan berfungsi sebagai dasar di mana pembelajaran berdasarkan pengalaman ini dapat terjadi. Beberapa percikan api beterbangan.
0:00:00 – Apakah LLM jalan buntu?
0:13:51 – Apakah manusia melakukan pembelajaran tiruan?
0:23:57 – Era Pengalaman
0:34:25 – Arsitektur saat ini digeneralisasi dengan buruk di luar distribusi
0:42:17 – Kejutan di bidang AI
0:47:28 – Akankah The Bitter Lesson masih berlaku setelah AGI?
0:54:35 – Suksesi AI
Cari Podcast Dwarkesh di YouTube, Apple Podcasts, Spotify, dll untuk menonton di sana dan berlangganan episode mendatang.
464,76K
Teratas
Peringkat
Favorit