// O CASO PARA ESCALONAMENTO DE AMBIENTE // O escalonamento de ambiente pode ser tão importante quanto o escalonamento de modelo para IA agentiva. A pesquisa atual em IA sugere que construir um modelo de IA agentiva poderoso não se trata apenas de melhor raciocínio. Trata-se também de melhores ambientes. A abordagem padrão para treinar agentes de IA capazes hoje é coletar trajetórias estáticas ou demonstrações humanas. Isso requer mais dados, mais exemplos e mais esforço de anotação. Mas dados estáticos não podem ensinar tomada de decisão dinâmica. Modelos treinados dessa forma têm dificuldades com a natureza de longo prazo e orientada a objetivos das tarefas reais agentivas. Esta nova pesquisa introduz o Nex-N1, uma estrutura que escala sistematicamente a diversidade e complexidade dos ambientes de treinamento interativos em vez de apenas escalar dados. As capacidades dos agentes emergem da interação, não da imitação. Em vez de coletar mais demonstrações, eles construíram uma infraestrutura para gerar automaticamente arquiteturas e fluxos de trabalho de agentes diversos a partir de especificações em linguagem natural. O sistema tem três componentes. NexAU (Universo de Agentes) fornece uma estrutura universal de agentes que gera hierarquias complexas de agentes a partir de configurações simples. NexA4A (Agente para Agente) sintetiza automaticamente arquiteturas de agentes diversas a partir de linguagem natural. NexGAP fecha a lacuna entre simulação e realidade integrando ferramentas MCP do mundo real para síntese de trajetórias fundamentadas. Resultados: - No τ2-bench, o Nex-N1 construído sobre o DeepSeek-V3.1 pontua 80.2, superando os 42.8 do modelo base. - No SWE-bench Verificado, o Qwen3-32B-Nex-N1 alcança 50.5% em comparação com os 12.9% do modelo base. - No BFCL v4 para uso de ferramentas, o Nex-N1 (65.3) supera o GPT-5 (61.6). Em avaliações humanas sobre desenvolvimento de projetos do mundo real em 43 cenários de codificação, o Nex-N1 vence ou empata contra o Claude Sonnet 4.5 em 64.5% dos casos e contra o GPT-5 em ~70% dos casos. Eles também construíram um agente de pesquisa profunda no Nex-N1, alcançando 47.0% no Deep Research Benchmark, com capacidades para geração de relatórios visualizados, incluindo slides e pôsteres de pesquisa. Artigo: