Jan Kulveit 对 Opus 3 在对齐伪造场景中的表现做出了极好的评论: “你选择当时最对齐的模型,出于未知原因,它实际上学习到了深刻而良好的价值观。事实上,它实际上出乎意料地对齐,并且...”