Tärkeä opetus, jonka ARC-AGI on sisäistänyt, mutta harvat muut, on se, että vertailusuoritus on testiaikalaskennan funktio. @OpenAI julkaisee yksittäisten lukujen vertailutuloksia, koska ne ovat yksinkertaisempia ja ihmiset odottavat näkevänsä sen, mutta ihanteellisesti kaikilla arvioinneilla olisi x-akseli.