¡Finalmente tuvimos un momento para ejecutar nuestro sistema con GPT-5.2 X-High en ARC-AGI-2! Usando el mismo arnés Poetiq que antes, vimos resultados de hasta el 75% a menos de $8 / problema utilizando GPT-5.2 X-High en el conjunto de datos completo PUBLIC-EVAL. Esto supera el SOTA anterior por ~15 puntos porcentuales.