AIで最悪の8日間の後の私のモデルスタック: Opus 4.5:ほとんどの日々のコーディング作業で、モデルに自分の望む動作をどうしてほしいかが分かっています。速く、クリーンで信頼性が高いですが、必要なコンテキストを十分に取得する前にコードを書き始めることがよくあります(一度測定して二度カット)。 Codex-Max:より大規模で難しいコードタスク(特にバックエンド)で、最善のやり方を決めたくない場合です。行動する前に探索するので、より信頼できることが多いです(2回測定し、1回カットします)。 GPT-5.1 Pro:深い計画、リサーチ、ハイリスクな仕事(特にバックエンド)で、間違いを犯す余裕はありません。微妙なミスを直したくなければ、GPT-5.1 Proを選びます。最初からうまくいくだけです(ただし非常に遅く、ChatGPTのインターフェースに固まってしまいます)。 Gemini 3 Pro:文章力、一般的な推論、UIデザイン。フロントエンドをAIの雑な感じではなく洗練された見た目に見せるのが得意ですが、一般的なコードタスクでは他より信頼性が劣ります。