Мне не нравятся эти бенчмарки. Хотелось бы увидеть сравнение между Sonnet 4.5, GPT-4 и Grok-4.