Grok 4 is nog steeds state-of-the-art op ARC-AGI-2 onder grensmodellen. 15,9% voor Grok 4 versus 9,9% voor GPT-5.
ARC Prize
ARC Prize8 aug, 01:29
GPT-5 op ARC-AGI Semi Private Eval GPT-5 * ARC-AGI-1: 65,7%, $0,51/tas * ARC-AGI-2: 9,9%, $0,73/tas GPT-5 Mini * ARC-AGI-1: 54,3%, $0,12/tas * ARC-AGI-2: 4,4%, $0,20/tas GPT-5 Nano * ARC-AGI-1: 16,5%, $0,03/tas * ARC-AGI-2: 2,5%, $0,03/tas
704