Grok 4.1 快速推理刚刚在 τ²-Bench-Verified 代理工具使用方面超越了新发布的 GPT‑5.2 (xHigh),并排名第一