我在AI领域经历了最疯狂的8天后的模型堆栈: Opus 4.5:大多数日常代码任务,我知道我希望模型如何执行我想要的。快速、干净、可靠,但通常在获取所需的所有上下文之前就开始编写代码(量一次,切两次)。 Codex‑Max:更大、更复杂的代码任务(尤其是后端),我不想规定最佳的执行方式。它在行动之前会进行探索,因此通常更可靠(量两次,切一次)。 GPT‑5.1 Pro:深度规划、研究、高风险工作(同样,尤其是后端),我不能承受错误。如果我不想处理微妙错误的修正,我会选择GPT-5.1 Pro。它第一次就能正确完成任务(但速度非常慢,并且被困在ChatGPT界面中)。 Gemini 3 Pro:写作、一般推理和UI设计。最擅长让前端看起来精致,而不是像AI的糟糕作品,但在一般代码任务上不如其他模型可靠。