Descubrí que estaba diseñando mis herramientas de IA al revés. Aquí hay un ejemplo. Esta era mi cadena de procesamiento de boletines: leer correos electrónicos, llamar a un procesador de boletines, extraer empresas y luego agregarlas al CRM. Esto implicó cuatro pasos diferentes, con un costo de $ 3.69 por cada mil boletines procesados. Antes: Cadena de procesamiento de boletines informativos (primera imagen) Luego creé una herramienta de boletín unificada que combinaba todo usando el Kit de desarrollo de agentes de Google, el marco de Google para crear herramientas de agentes de IA de grado de producción: (segunda imagen) ¿Por qué es más complicada la herramienta de boletines unificados? Incluye múltiples acciones en una sola interfaz (procesar, buscar, extraer, validar), implementa la gestión de estado que rastrea los patrones de uso y almacena en caché los resultados, tiene limitación de velocidad incorporada y produce salidas JSON estructuradas con metadatos en lugar de texto sin formato. Pero aquí está la parte contraria a la intuición: a pesar de ser más compleja internamente, la herramienta unificada es más simple de usar para el LLM porque proporciona salidas consistentes y estructuradas que son más fáciles de analizar, aunque esas salidas son más largas. Para comprender el impacto, realizamos pruebas de 30 iteraciones por escenario de prueba. Los resultados muestran el impacto de la nueva arquitectura: (tercera imagen) Pudimos reducir los tokens en un 41% (p = 0,01, estadísticamente significativo), lo que se tradujo linealmente en ahorros de costos. La tasa de éxito mejoró en un 8% (p = 0.03), y pudimos alcanzar el caché el 30% de las veces, lo que es otro ahorro de costos. Si bien las herramientas individuales produjeron respuestas más cortas y "limpias", obligaron al LLM a trabajar más duro analizando formatos inconsistentes. Los resultados estructurados y completos de herramientas unificadas permitieron un procesamiento de LLM más eficiente, a pesar de ser más largo. Mi flujo de trabajo se basaba en docenas de herramientas Ruby especializadas para correo electrónico, investigación y gestión de tareas. Cada herramienta tenía su propia interfaz, manejo de errores y formato de salida. Al agruparlos en herramientas meta, el rendimiento final es mejor y hay un tremendo ahorro de costos. Puede encontrar la arquitectura completa en GitHub.