Una lección importante que ARC-AGI ha internalizado, pero que no muchos otros han, es que el rendimiento de referencia es una función del cómputo en el momento de la prueba. @OpenAI publica resultados de referencia de un solo número porque es más simple y la gente espera verlo, pero lo ideal sería que todas las evaluaciones tuvieran un eje x.