El salto de "los agentes no están ni cerca de funcionar" a "bueno, los agentes específicos para investigación y codificación funcionan bastante bien" y (muy recientemente) "los agentes de propósito general son realmente útiles para una variedad de tareas" ha sido lo suficientemente rápido (menos de un año) como para que la mayoría de la gente no se haya dado cuenta.
Por supuesto, los agentes todavía tienen muchos problemas, pero en términos de uso de herramientas, número de pasos de trabajo y reducción de tasas de error, es un gran avance en comparación con o1-preview de hace un año. Incluso Deep Research y los diversos agentes de codificación parecen capacidades que no habríamos esperado hace un año.
158,89K