Nu-mi plac aceste repere. Mi-ar fi plăcut să văd o comparație între Sonnet 4.5, GPT-4 și Grok-4