私は、Anthropic モデルを「軽い推論」モデルとして見始めていますが、OpenAI モデルは「深い推論」モデルです。 「軽い推論」だけで、ソネット 4.5 は情報を正確に特定するための効率的なコンテキスト使用に優れています。 Codex ツールの呼び出しはかさばり、仮説を検証するための推論トークンが散在しています。問題をより深く理解するために、文脈を切望しています。 GPT-5 と Sonnet 4.5 の間のギャップは、新しいツール呼び出しを必要としない「ホット」コンテキスト ウィンドウがある場合に明らかになります。 GPT-5 は詳細な完全な解決策を見つけるために数分かけて考えることができますが、Sonnet 4.5 は数秒でサービス可能な解決策を見つけることができます。 深い推論は十分なコンテキストでのみ機能しますが、モデルが問題を非常に徹底的に評価することを可能にするため、ほとんど超人的に見えます。 対照的に、光の推論は表面に近い位置にとどまりますが、モデルが思考をまとめるための息抜きの余地として機能します。それは多くの点ではるかに人間的です。 Anthropic は軽い推論でははるかに先を行っています。最小限の思考を持つ Gpt-5 は、多くのテストで 4o よりも知能が低くなります。 私は、Google が Flash 3 をライト推論に、pro / ultra 3 をディープ推論に両面で戦うことを期待しています。