đối với các nhiệm vụ suy luận phức tạp, tôi thấy mình đang chạy claude, grok, gpt, gemini tất cả cùng một lúc và so sánh các câu trả lời