Я начинаю рассматривать модели Anthropic как модели "легкого рассуждения", в то время как модели OpenAI являются моделями "глубокого рассуждения". С помощью только "легкого рассуждения" Sonnet 4.5 превосходно использует контекст для точного определения информации. Вызовы инструмента Codex громоздки, и они перемежаются токенами рассуждения для проверки гипотез. Ему нужен контекст, чтобы лучше понять проблему. Разница между GPT-5 и Sonnet 4.5 становится очевидной, когда у вас есть "горячее" окно контекста, где не требуется новых вызовов инструментов. GPT-5 может думать в течение минут, чтобы найти детальное полное решение, в то время как Sonnet 4.5 удовлетворяется несколькими секундами для приемлемого решения. Глубокое рассуждение работает только с достаточным контекстом, но позволяет модели действительно оценивать проблемы так исчерпывающе, что это кажется почти сверхчеловеческим. В отличие от этого, легкое рассуждение остается ближе к поверхности, но служит пространством для моделей, чтобы собрать свои мысли. Во многих отношениях это гораздо более человеческое. Anthropic значительно опережает в легком рассуждении. GPT-5 с минимальным мышлением менее интеллектуален, чем 4o во многих тестах. Я ожидаю, что Google будет бороться на обоих фронтах, с flash 3 в легком рассуждении и pro / ultra 3 в глубоком рассуждении.