Zaczynam postrzegać modele Anthropic jako modele "lekkiego rozumowania", podczas gdy modele OpenAI to modele "głębokiego rozumowania". Dzięki "lekkim rozumowaniom" Sonnet 4.5 doskonale radzi sobie z efektywnym wykorzystaniem kontekstu do precyzyjnego wskazywania informacji. Wywołania narzędzia Codex są nieporęczne i są przerywane tokenami rozumowania w celu testowania hipotez. Potrzebuje kontekstu, aby lepiej zrozumieć problem. Różnica między GPT-5 a Sonnet 4.5 staje się oczywista, gdy masz "gorące" okno kontekstowe, w którym nie są potrzebne nowe wywołania narzędzi. GPT-5 może myśleć przez minuty, aby znaleźć szczegółowe, kompletne rozwiązanie, podczas gdy Sonnet 4.5 zadowala się kilkoma sekundami na użyteczne rozwiązanie. Głębokie rozumowanie działa tylko przy wystarczającym kontekście, ale pozwala modelowi naprawdę ocenić problemy tak wyczerpująco, że wydaje się niemal nadludzkie. Z drugiej strony, lekkie rozumowanie pozostaje bliżej powierzchni, ale służy jako przestrzeń do zebrania myśli przez modele. W wielu aspektach jest znacznie bardziej ludzkie. Anthropic zdecydowanie przoduje w lekkim rozumowaniu. GPT-5 przy minimalnym myśleniu jest mniej inteligentny niż 4o w wielu testach. Spodziewam się, że Google będzie walczyć na obu frontach, z flash 3 w lekkim rozumowaniu i pro / ultra 3 w głębokim rozumowaniu.