le tl;dr de l'interview de Dwarkesh Patel avec Ilya Sutskever • Les approches actuelles « iront loin puis s'essouffleront » ; elles continueront à s'améliorer, mais ne livreront pas d'AGI. • Le type de système qui fonctionnerait est quelque chose « que nous ne savons pas encore comment construire. » • Des impacts significatifs sur le marché du travail sont attendus dans les années à venir. • Principal goulot d'étranglement : la généralisation. Les modèles sont bien moins performants que les humains à ce sujet. • Vous pouvez vous entraîner sur chaque problème de programmation compétitive, et le modèle ne développera toujours pas de véritable « goût », tandis qu'un adolescent apprend à conduire en ~10 heures. • Les scores d'évaluation semblent excellents, mais la performance dans le monde réel est en retard car l'entraînement RL finit par s'optimiser pour les évaluations elles-mêmes. • Les véritables hackers de récompenses sont les chercheurs qui élaborent ces benchmarks et ces boucles d'entraînement. • Il dit avoir des idées sur ce qui manque, mais ne les partagera pas publiquement. • L'ASI cependant dans 5 à 20 ans "Vous savez ce qui est fou ? Que tout cela est réel" J'ai vraiment ressenti cette phrase.