Descubrí que estaba diseñando mis herramientas de IA al revés. Aquí hay un ejemplo. Esta era mi cadena de procesamiento de boletines: leer correos electrónicos, llamar a un procesador de boletines, extraer empresas y luego agregarlas al CRM. Esto involucraba cuatro pasos diferentes, costando $3.69 por cada mil boletines procesados. Antes: Cadena de Procesamiento de Boletines (primera imagen) Luego creé una herramienta de boletín unificada que combinaba todo usando el Kit de Desarrollo de Agentes de Google, el marco de Google para construir herramientas de agentes de IA de grado de producción: (segunda imagen) ¿Por qué es más complicada la herramienta de boletín unificada? Incluye múltiples acciones en una sola interfaz (procesar, buscar, extraer, validar), implementa gestión de estado que rastrea patrones de uso y almacena en caché los resultados, tiene limitación de tasa incorporada y produce salidas JSON estructuradas con metadatos en lugar de texto plano. Pero aquí está la parte contraintuitiva: a pesar de ser más compleja internamente, la herramienta unificada es más simple para el LLM porque proporciona salidas consistentes y estructuradas que son más fáciles de analizar, aunque esas salidas sean más largas. Para entender el impacto, realizamos pruebas de 30 iteraciones por escenario de prueba. Los resultados muestran el impacto de la nueva arquitectura: (tercera imagen) Pudimos reducir los tokens en un 41% (p=0.01, estadísticamente significativo), lo que se tradujo linealmente en ahorros de costos. La tasa de éxito mejoró en un 8% (p=0.03), y pudimos acceder a la caché el 30% del tiempo, lo que representa otro ahorro de costos. Mientras que las herramientas individuales producían respuestas más cortas y "limpias", forzaban al LLM a trabajar más duro analizando formatos inconsistentes. Las salidas estructuradas y completas de las herramientas unificadas permitieron un procesamiento más eficiente del LLM, a pesar de ser más largas. Mi flujo de trabajo dependía de docenas de herramientas especializadas en Ruby para correo electrónico, investigación y gestión de tareas. Cada herramienta tenía su propia interfaz, manejo de errores y formato de salida. Al agruparlas en herramientas meta, el rendimiento final es mejor y hay un ahorro de costos tremendo. Puedes encontrar la arquitectura completa en GitHub.