在透過Cursor和網頁應用中的GPT-5 Pro模型進行幾天的密集使用後,我堅持我所說的一切,認為它是一個更聰明的模型,在編碼方面比Opus 4.1更優秀。 我仍然喜歡Opus,並且在許多方面發現Claude Code的使用體驗更好,但如果你試圖做一些真正困難的事情,需要真正聰明的第一性原理思維和計算機科學能力,GPT-5是一個更高的水平。 但我懷疑這只有在推理努力模式設置為至少中等時才會顯現出來,並且在高努力設置下真正表現出來。 一個好的例子是準備兩份長而複雜的法律文件的“紅線”文檔。不是同一文檔的不同版本,而是來自共享通用模板的兩份不同文檔。 這是一個非常非常難以做好工作的難題,需要許多聰明的技巧和啟發式方法來提供體面的性能和輸出質量(我在這裡談論的是使用傳統編程技術,而不是使用LLM進行這種比較)。 與Opus 4.1相比,使用Cursor代理的GPT-5可以更快地提出更多、更好、更聰明(但務實)的想法,並且能夠正確實施這些想法,而不需要太多的指導。 不過,這取決於你正在做的工作。例如,我仍然認為我更喜歡Opus的NextJS前端代碼。 但你絕對應該在自己的實際問題上進行檢查,而不是相信那些說模型糟糕並且證明我們已經碰壁的許多人。 要麼他們在沒有思考的情況下使用糟糕的免費版本,要麼他們根本不知道如何有效地提示,或者他們讓自己對OpenAI和Altman的感情影響了他們的看法。
35.61K