Después de que salieron los LLM, el lanzamiento de la capa de aplicación nunca se detuvo. Desde el ajuste rápido hasta la configuración del flujo de trabajo y la creación de agentes, el objetivo final es el mismo: hacer que los LLM funcionen mejor para los humanos y exprimir el rendimiento de la máquina al extremo. La compresión de los LLM se puede dividir en dos dimensiones. La primera es ayudarlo a encontrar el algoritmo óptimo y hacer que el razonamiento sea menos desviado. Con este fin, hemos recorrido casi todos los caminos que se nos ocurren, permitiendo que los LLM aprendan a reflexionar (reflexión, autoconsistencia, autocríticas) y aprendan a razonar y planificar (razonamiento, planificación, cadena de pensamiento, árbol de pensamiento). aprender a memorizar (memoria a corto plazo, memoria a largo plazo) para no perder la memoria después de una larga conversación; aprender a encontrar conocimiento (RAG, gráfico de conocimiento) y complementar hechos en el mundo externo; Aprenda a construir la construcción de contexto para meter más información válida en tokens finitos. Aprenda a usar herramientas (uso de herramientas, llamada a funciones, MCP) para dejar que las cosas se ejecuten en programas externos, en lugar de generarlas usted mismo; Espera un momento. El propósito esencial de estas cosas es ayudar a los LLM a comprender lo que los humanos están haciendo más rápido, encontrar el camino menos costoso alrededor de lo orientado a objetivos y correr hacia la solución óptima. La segunda dimensión es la reducción del tiempo, lo que permite a los LLM trabajar las 24 horas del ×día, los 7 días de la semana. Cuando tenemos una comprensión más profunda de los LLM, es fácil pensar en ellos como "empleados digitales" para nosotros o nuestra organización, que son incansables y no pueden quejarse, y pueden continuar operando y aprendiendo. La mayoría de las personas usan IA hoy en día y todavía están atrapadas en escenarios de un solo punto, como verificar información, resumir contenido y escribir informes semanales. Primero debemos planificar nuestra propia fábrica digital de IA: pensar claramente en qué "producto" queremos crear, ya sea un sistema que acumule conocimiento, un proceso comercial automatizado o un servicio que se pueda iterar durante un largo período de tiempo. En esta fábrica, la IA es el verdugo en la línea de producción, responsable del procesamiento y la producción específicos; El papel de los seres humanos ha cambiado, de "trabajadores que trabajan en persona" a "supervisores y gerentes". En lugar de hacer cada paso a mano, los humanos diseñan canalizaciones, establecen reglas, establecen métricas, monitorean la calidad y programan recursos cuando es necesario. En otras palabras, el valor de la IA no es "hacer un poco de trabajo" por nosotros, sino ayudar a ejecutar toda la línea de montaje, y los humanos son más como "gerentes de fábricas digitales". Cuando se combinan estas dos dimensiones, surge el verdadero punto de inflexión. Los LLM ya no son solo herramientas frías, sino que gradualmente se convierten en socios que pueden colaborar durante mucho tiempo. Puede asumir un trabajo repetitivo y proporcionar información sobre problemas complejos. No se trata solo de "hacer cosas por ti", se trata de "hacer cosas contigo". La brecha en el futuro no se trata de quién puede escribir indicaciones más hermosas, sino de quién puede realmente integrar los LLM en su tiempo y organización para formar un método de producción estable. Por lo tanto, si se utilizará, qué profundidad utilizará y si se puede optimizar continuamente son las fuentes de competitividad a largo plazo. Quien pueda ejecutar la IA como una "fábrica" y transformarse de ejecutores a supervisores y gerentes obtendrá beneficios verdaderamente reutilizables y acumulativos en su trabajo diario y negocios en el futuro.