"Deberías usar más a Bash." En las últimas semanas, Thariq de Anthropic ha mantenido llamadas de conferencia con decenas de empresas que fabrican agentes de propósito general. Asistentes de correo, bots de atención al cliente, gestión de horarios: hay todo tipo de formularios de producto. Después de charlar un rato, se sorprendió repitiendo la misma frase una y otra vez. ¿Bash? ¿No es eso una herramienta de línea de comandos para programadores, y qué tiene que ver con estos productos? Veamos primero un escenario concreto. Supongamos que tienes un agente de correo electrónico y le preguntas: "¿Cuánto he gastado en taxi esta semana?" ” El enfoque tradicional es este: el agente llama a la API para extraer el correo, puede recuperar 100 correos a la vez y luego pedir al modelo que busque recibos de Uber y Lyft, sumando la cantidad. El problema es que 100 mensajes están comprimidos en contexto, y el modelo tiene que recordarlos al mismo tiempo, filtrarlos y calcularlos. Esto no es fácil para modelos de lenguaje grandes. Es fácil de pasar por alto, es fácil cometer errores y no puedes verificar qué correos lee. Este es un problema típico de zona de confort del modelo: la cantidad de datos no es lo suficientemente grande para ser procesada por un programa especial, pero está fuera de la capacidad del modelo para realizar cálculos duros de una sola vez. Atrapado en medio, es incómodo. La solución de Thariq es darle al agente una herramienta Bash y dejar que guarde los resultados intermedios como un archivo. Parece sencillo, pero la lógica detrás es interesante. Una llamada tradicional a la herramienta sería así: La herramienta → el modelo procesa → salida Todos los estados intermedios están en el "cerebro" del modelo, que no puedes ver ni comprobar. Tras cambiar a Bash, el proceso cambió: Herramientas → guardar archivos→ búsqueda/filtro, → procesamiento de modelos → resultados de salida ...