Tôi không thích những tiêu chuẩn này. Tôi rất muốn thấy một số so sánh giữa Sonnet 4.5, GPT-4 và Grok-4.