Een belangrijke les die ARC-AGI heeft geïnternaliseerd, maar die niet veel anderen hebben, is dat benchmarkprestaties een functie zijn van de rekentijd tijdens de test. @OpenAI publiceert enkelvoudige benchmarkresultaten omdat het eenvoudiger is en mensen verwachten het te zien, maar idealiter zouden alle evaluaties een x-as moeten hebben.