Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
En Box, pasamos mucho tiempo probando Box AI con nuevos modelos en datos no estructurados para ver en qué funcionan bien en áreas reales de trabajo de conocimiento.
Como hemos visto en los puntos de referencia, GPT-5 ofrece un salto significativo en la capacidad sobre GPT-4.1 en razonamiento, matemáticas, lógica, codificación y otras áreas de trabajo. Estos son algunos ejemplos de dónde entran en juego esas mejoras en el mundo real:
*GPT 5 contextualiza mejor la información. Al realizar la extracción de datos, como el importe final en USD de una factura sin etiquetas de moneda pero con una dirección en Londres, GPT 5 responde correctamente necesitando una tasa de conversión de USD a GBP. En comparación, GPT 4.1 vio la factura final y la devolvió, asumiendo la moneda (incorrectamente).
* GPT-5 ofrece un mejor análisis multimodal. Para la presentación anual de una empresa pública, se le pide a GPT-5 que aísle una celda en una tabla de una imagen que muestra los cambios en los componentes de capital de la empresa. La parte superior de la tabla aclara que todos los montos de acciones están en miles, y GPT-5 establece claramente esta conversión, mientras que GPT-4.1 no lo hace, confundiéndose dado que la tabla dice acciones y la leyenda dice acciones.
* GPT-5 funciona mejor con altos niveles de complejidad de datos y avisos. Al realizar la extracción de datos en un currículum para todas las fechas de inicio del trabajo, los nombres de los puestos de trabajo y los nombres de los empleadores, GPT-5 pudo extraer todos los datos, mientras que GPT-4.1 parece sentirse abrumado y no extrajo los mismos campos dado el tamaño del mensaje y la complejidad del documento.
* GPT-5 es mucho más claro y explícito en sus respuestas. En un acuerdo de subcontratación con 6 servicios diferentes discutidos explícitamente, cuando se le pregunte sobre "los 5 servicios específicos en el contrato", GPT-5 devolverá los primeros 5 y preguntará si fue intencional que no se preguntara sobre el sexto. En comparación, GPT-4.1 simplemente devolvió los primeros 5 sin más advertencias, lo que puede generar confusión en el usuario.
* GPT-5 es mejor en la interpretación de datos en campos complejos. Para un gráfico de citometría de flujo, que se utiliza normalmente en inmunología, GPT-5 identificó correctamente una alta proporción de células muertas y dio causas raíz plausibles que podrían conducir a la situación, mientras que GPT-4.1 dio un razonamiento mínimo, necesitando más confirmación para tener conjeturas a partir de datos sin procesar.
* GPT-5 es más capaz de identificar inconsistencias en el código. Cuando se le pidió que identificara problemas en un archivo de código de Python determinado, mientras que tanto GPT-5 como 4.1 pueden identificar errores reales que conducen a un mal funcionamiento, solo GPT-5 pudo inferir problemas más sutiles, como imprimir la variable incorrecta cuando eso no tendría sentido en el contexto del programa.
Estas mejoras en matemáticas, razonamiento, lógica y calidad de las respuestas en ventanas de contexto más largas son increíblemente útiles para los usuarios finales en el trabajo diario, pero aparecerán aún más con agentes de IA de ejecución más prolongada, especialmente cuando no hay un humano en el circuito para verificar la información en cada paso.
Es increíble ver que estas mejoras siguen llegando en la última cosecha de modelos de IA, ya que esto conducirá a que los agentes de IA puedan usarse en áreas de trabajo cada vez más críticas.
77.96K
Populares
Ranking
Favoritas