我们对 Opus 4.5 在编码任务上进行了基准测试! 我们发现它在许多方面与 GPT 5.1 相当,并且比 Sonnet 4.5 有所改进。 如果 Sonnet 4.5 感觉像一位老师,而 GPT-5.1 像一个队友,那么 Opus 4.5 就是审查你 PR 的建筑师!