Este novo artigo é insano! Sugere que agentes baseados em LLM operam de acordo com leis físicas macroscópicas, de forma semelhante ao comportamento das partículas em sistemas termodinâmicos. E parece que é uma descoberta que se aplica a todos os modelos. Agentes de LLM funcionam muito bem em diferentes domínios, mas não temos uma teoria do porquê. O comportamento desses sistemas é frequentemente visto como um produto direto de engenharia interna complexa: templates de prompt, módulos de memória e chamadas sofisticadas de ferramentas. A dinâmica continua sendo uma caixa preta. Essa nova pesquisa sugere que agentes movidos por LLMs exibem equilíbrio detalhado, uma propriedade fundamental dos sistemas de equilíbrio na física. O que isso significa? Sugere que LLMs não aprendem apenas conjuntos de regras e estratégias; eles podem estar implicitamente aprendendo uma função potencial subjacente que avalia estados globalmente, capturando algo como "quão longe o LLM percebe que um estado está do objetivo." Isso permite a convergência direcionada sem ficar preso em ciclos repetitivos. Os pesquisadores incorporaram LLMs em estruturas de agentes e mediram probabilidades de transição entre estados. Usando um princípio de ação mínima da física, eles estimaram a função potencial que governa essas transições. Os resultados nas transições de estado GPT-5 Nano, Claude-4 e Gemini-2.5-flash: atendem em grande parte à condição detalhada de equilíbrio. Isso indica que sua dinâmica generativa apresenta características semelhantes às de sistemas de equilíbrio. Em uma tarefa simbólica com 50.228 transições de estado em 7.484 estados diferentes, 69,56% das transições de alta probabilidade se moveram para um potencial menor. A função potencial capturava características em nível de expressão, como complexidade e validade sintática, sem precisar de informações em nível de string. Modelos diferentes apresentaram comportamentos distintos no espectro exploração-exploração. Claude-4 e Gemini-2.5-flash convergiram rapidamente para alguns estados. O GPT-5 Nano explorou amplamente, produzindo 645 saídas válidas diferentes em 20.000 gerações. Esta pode ser a primeira descoberta de uma lei física macroscópica na dinâmica generativa de LLM que não depende de detalhes específicos do modelo. Sugere que podemos estudar agentes de IA como sistemas físicos com propriedades mensuráveis e previsíveis, em vez de apenas artefatos de engenharia. Papel: Aprenda a construir Agentes de IA eficazes em nossa academia: