TL; Dr. av Dwarkesh Patel-intervjuet med Ilya Sutskever •Nåværende tilnærminger vil «gå en bit og så Peter ut», de vil fortsette å bli bedre, men vil ikke levere AGI. •Typen system som ville fungere er noe «vi ennå ikke vet hvordan vi skal bygge.» • Betydelige konsekvenser for arbeidsmarkedet forventes i årene som kommer. •Hovedflaskehals: generalisering. Modeller er langt dårligere enn mennesker på det. •Du kan trene på alle konkurranseprogrammeringsproblemer, og modellen utvikler fortsatt ikke ekte «smak», mens en tenåring lærer å kjøre på ~10 timer. •Evalueringspoengene ser flotte ut, men reell ytelse henger fordi RL-treningen ender opp med å optimalisere for selve evalueringene. •De virkelige belønningshackerne er forskerne som lager disse benchmarkene og treningssløyfene. •Han sier han har ideer om hva som mangler, men vil ikke dele dem offentlig. • ASI men innen 5–20 år "Vet du hva som er sprøtt? At alt dette er ekte" Jeg følte virkelig den setningen.