Ważną lekcją, którą ARC-AGI przyswoiło, ale nie wiele innych, jest to, że wydajność benchmarku jest funkcją obliczeń w czasie testu. @OpenAI publikuje wyniki benchmarków w postaci pojedynczej liczby, ponieważ jest to prostsze i ludzie oczekują, że to zobaczą, ale idealnie wszystkie oceny powinny mieć oś x.