Filtraciones de la cuenta X TestingCatalog: Google ha añadido un modo de "investigación automática" con múltiples agentes en Gemini Enterprise. Google está desarrollando un sistema de múltiples agentes en Gemini for Enterprise. Le das un tema y un conjunto de criterios de evaluación, y puede generar una gran cantidad de ideas por sí mismo, luego reunir un equipo completo de agentes para evaluar estas ideas en rondas, como en un torneo. Este sistema puede trabajar de forma continua durante aproximadamente 40 minutos. Para un producto dirigido a usuarios empresariales comunes, este ya es un proceso de razonamiento continuo bastante largo. Al final de estos 40 minutos, el usuario recibirá una larga lista de ideas, clasificadas de mejor a peor según los criterios que estableciste al principio. La escala también es considerable: el sistema puede generar alrededor de 100 ideas a la vez. Para cada idea, puedes obtener: - Un resumen - Una explicación más detallada - Un resumen de comentarios - Una reseña completa - Y un informe de "desempeño en torneo" (tournament performance report) Este "informe de desempeño" es una salida separada que se puede abrir y revisar lentamente. Todas las ideas generadas son seleccionables, puedes hacer clic en cualquiera de ellas para profundizar. En la versión beta actual, Google parece haber integrado tres agentes, de los cuales dos están basados en este sistema de "torneo" de múltiples agentes. El primero se llama "Idea Generation" (Generación de Ideas). En este modo, solo necesitas dar un tema, y este agente iniciará todo el flujo de trabajo de múltiples agentes, utilizando una "evaluación estilo torneo" (tournament-style evaluation) para generar y clasificar varias ideas relacionadas. (Lo que se llama estilo torneo significa que las propuestas se enfrentan entre sí, las que ganan se quedan, las débiles son eliminadas). El segundo se llama "Co-scientist" (Científico Colaborador). Este se inclina más hacia escenarios de investigación y ciencia. Puedes especificar un tema de investigación y proporcionar algunos datos adicionales, y luego todo un equipo de agentes generará direcciones y propuestas de investigación, y evaluará estas ideas utilizando el mismo mecanismo de torneo, aunque esta vez se enfatizará más la necesidad de investigación y exploración científica. Lo más interesante aquí es que claramente se ha invertido una potencia de cálculo muy exagerada detrás de esto. Permitir que los agentes trabajen en una tarea durante aproximadamente 40 minutos se considera una "configuración de lujo" en la mayoría de las herramientas de agentes actuales. Durante esos 40 minutos, el sistema iterará constantemente sobre el problema, generando, filtrando, puntuando y reorganizando. Actualmente, todo esto solo aparece en Gemini for Enterprise, en una fase de desarrollo interno, y está oculto para los usuarios comunes, aún no se ha abierto al público como una función oficial. Comparado con las implementaciones actuales de agentes, este conjunto parece ser un avance significativo. Incluso aquellos agentes avanzados que ya tienen modo de navegador suelen estar limitados por la ventana de contexto y el presupuesto de tiempo (time budget)....