Mô hình của tôi sau 8 ngày điên rồ nhất trong AI: Opus 4.5: Hầu hết các nhiệm vụ mã hàng ngày mà tôi biết cách tôi muốn mô hình thực hiện điều tôi muốn. Nhanh, sạch sẽ, đáng tin cậy, nhưng thường bắt đầu viết mã trước khi nắm bắt tất cả bối cảnh cần thiết (đo một lần, cắt hai lần). Codex‑Max: Các nhiệm vụ mã lớn hơn, khó khăn hơn (đặc biệt là backend) mà tôi không muốn chỉ định cách tốt nhất để làm điều gì đó. Khám phá trước khi hành động, vì vậy nó thường đáng tin cậy hơn (đo hai lần, cắt một lần). GPT‑5.1 Pro: Lập kế hoạch sâu, nghiên cứu, công việc có tính rủi ro cao (một lần nữa, đặc biệt là backend) mà tôi không thể sai lầm. Nếu tôi không muốn phải xử lý việc sửa chữa những sai sót tinh tế, tôi chọn GPT-5.1 Pro. Nó chỉ làm đúng ngay từ lần đầu tiên (nhưng nó rất chậm, và bị kẹt trong giao diện ChatGPT). Gemini 3 Pro: Viết, lý luận tổng quát và thiết kế UI. Tốt nhất trong việc làm cho giao diện người dùng trông bóng bẩy hơn là như một mớ hỗn độn của AI, nhưng kém đáng tin cậy hơn so với những cái khác trong các nhiệm vụ mã tổng quát.