Después de varios días más de uso intensivo de GPT-5 a través de Cursor y del modelo GPT-5 Pro en la aplicación web, mantengo todo lo que dije sobre que es un modelo mucho más inteligente y mejor en programación que Opus 4.1. Todavía me gusta Opus y encuentro que la ergonomía de Claude Code es más agradable en muchos aspectos, pero si estás tratando de hacer cosas realmente difíciles que requieren un pensamiento verdaderamente ingenioso basado en principios fundamentales y habilidades en ciencias de la computación, GPT-5 es de otro nivel. Pero sospecho que esto solo emerge cuando el modo de esfuerzo de razonamiento se establece al menos en medio, y realmente se manifiesta con la configuración de alto esfuerzo. Un buen ejemplo de problema es preparar "redlines" de dos documentos legales largos y complejos. No versiones diferentes del mismo documento, sino dos documentos diferentes que provienen de una plantilla general compartida. Este es un problema muy, muy difícil de resolver bien, y requiere muchos trucos ingeniosos y heurísticas para ofrecer un rendimiento y calidad de salida decentes (estoy hablando de usar técnicas de programación tradicionales aquí, no de usar LLMs para hacer esta comparación). GPT-5 con el agente Cursor puede simplemente generar más, mejores, ingeniosas (pero pragmáticas) ideas más rápido, e implementarlas correctamente y sin mucha guía, en comparación con Opus 4.1. Depende de en qué estés trabajando, sin embargo. Aún creo que prefiero el código frontend en NextJS de Opus, por ejemplo. Pero deberías comprobarlo tú mismo en tus propios problemas reales y no confiar en todas las muchas personas que dicen que el modelo es malo y que es prueba de que hemos llegado a un muro. O están usando la mala versión gratuita sin pensar, o no tienen idea de cómo hacer un buen prompt, o están dejando que sus sentimientos hacia OpenAI y Altman coloreen sus opiniones.
35,62K