Mi pila de modelos después de los 8 días más salvajes en IA: Opus 4.5: La mayoría de las tareas diarias de codificación donde sé cómo quiero que el modelo haga lo que quiero. Rápido, limpio, confiable, pero a menudo comienza a escribir código antes de captar todo el contexto que necesita (mide una vez, corta dos). Codex‑Max: Tareas de codificación más grandes y difíciles (especialmente backend) donde no quiero prescribir la mejor manera de hacer algo. Explora antes de actuar, por lo que a menudo es más confiable (mide dos veces, corta una). GPT‑5.1 Pro: Planificación profunda, investigación, trabajo de alto riesgo (nuevamente, especialmente backend) donde no puedo permitirme estar equivocado. Si no quiero tener que lidiar con la corrección de errores sutiles, recurro a GPT-5.1 Pro. Simplemente lo hace bien la primera vez (pero es súper lento y está atrapado en la interfaz de ChatGPT). Gemini 3 Pro: Escritura, razonamiento general y diseño de UI. Mejor en hacer que las interfaces se vean pulidas en lugar de como un desastre de IA, pero menos confiable que otros en tareas de codificación generales.