Sholto Douglas (Anthropic): "En el último año, el RL finalmente nos ha permitido tomar un bucle de retroalimentación y convertirlo en un modelo que es al menos tan bueno como los mejores humanos en una tarea específica en un dominio estrecho. Y eso se está viendo con las matemáticas y el código de competencia, que son los dos dominios más susceptibles a esto, donde rápidamente los modelos se están volviendo increíblemente competentes como matemáticos de competencia y programadores de competencia. No hay nada intrínsecamente diferente entre el código de competencia y las matemáticas. Simplemente es que son realmente [más] susceptibles al RL que cualquier otro dominio. Pero, lo más importante, demuestran que no hay un techo intelectual en los modelos. Son capaces de realizar razonamientos realmente difíciles dado el bucle de retroalimentación adecuado. Así que pensamos que ese mismo enfoque se generaliza a prácticamente todos los demás dominios del esfuerzo intelectual humano donde, dado el bucle de retroalimentación adecuado, estos modelos [se volverán] al menos tan buenos como los mejores humanos en una tarea específica. Y luego, una vez que tienes algo que es al menos tan bueno como los mejores humanos en una tarea, puedes ejecutar 1,000 de ellos en paralelo o 100 veces más rápido y tienes algo que, solo con esa condición, es sustancialmente más inteligente que cualquier humano dado. Y esto deja completamente de lado si es posible crear algo que sea más inteligente que un humano. Las implicaciones de esto son bastante asombrosas, ¿verdad? En los próximos 2 o 3 años, dado los bucles de retroalimentación adecuados, dado el cómputo adecuado, etc., pensamos que nosotros, como industria de IA en su conjunto, estamos en camino de crear algo que sea al menos tan capaz como la mayoría de los humanos en la mayoría de las tareas relacionadas con computadoras, posiblemente tan bueno como muchos de nuestros mejores científicos en sus campos. Será agudo y espinoso, habrá ejemplos de cosas que no puede [hacer]. Pero el mundo cambiará. ... Creo que esto vale la pena gritarlo desde los tejados un poco - chicos, cualquier cosa que podamos medir parece estar mejorando realmente rápido. ¿A dónde nos lleva eso en 2 o 3 años? No puedo decirlo con certeza. Pero creo que vale la pena incorporarlo en las visiones del mundo que hay una posibilidad bastante seria de que obtengamos AGI."