o resumo da entrevista de Dwarkesh Patel com Ilya Sutskever • As abordagens atuais "vão avançar um pouco e depois vão estagnar"; continuarão a melhorar, mas não entregarão AGI. • O tipo de sistema que funcionaria é algo "que ainda não sabemos como construir." • Esperam-se impactos significativos no mercado de trabalho nos próximos anos. • Principal gargalo: generalização. Os modelos são muito piores que os humanos nisso. • Você pode treinar em todos os problemas de programação competitiva, e o modelo ainda não desenvolverá um verdadeiro "gosto", enquanto um adolescente aprende a dirigir em ~10 horas. • As pontuações de avaliação parecem ótimas, mas o desempenho no mundo real fica atrás porque o treinamento de RL acaba otimizando para as avaliações em si. • Os verdadeiros hackers de recompensa são os pesquisadores que elaboram esses benchmarks e ciclos de treinamento. • Ele diz que tem ideias sobre o que está faltando, mas não as compartilhará publicamente. • ASI, no entanto, dentro de 5-20 anos "Você sabe o que é louco? Que tudo isso é real" Eu realmente senti essa frase.