我們對 Opus 4.5 在編碼任務上進行了基準測試! 我們發現它在許多方面等同於 GPT 5.1,並且比 Sonnet 4.5 有所改進。 如果 Sonnet 4.5 感覺像是一位老師,而 GPT-5.1 像是一位隊友,那麼 Opus 4.5 就是審查你 PR 的建築師!