Finalmente tivemos um momento para rodar nosso sistema com GPT-5.2 X-High em ARC-AGI-2! Usando o mesmo harness Poetiq de antes, vimos resultados de até 75% a menos de $8 / problema usando GPT-5.2 X-High no conjunto completo de dados PUBLIC-EVAL. Isso supera o SOTA anterior em ~15 pontos percentuais.