Jag gillar inte dessa riktmärken. Skulle gärna ha sett en jämförelse mellan Sonnet 4.5, GPT-4 och Grok-4