Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O CASO A FAVOR DA ESCALONAMENTO AMBIENTAL //
A escalabilidade do ambiente pode ser tão importante quanto a escalabilidade de modelos para IA agente.
Pesquisas atuais em IA sugerem que construir um modelo de IA agente poderoso não é apenas uma questão de melhor raciocínio. Também é sobre ambientes melhores.
A abordagem padrão para treinar agentes de IA capazes hoje é coletar trajetórias estáticas ou demonstrações humanas. Isso exige mais dados, mais exemplos e mais esforço de anotação.
Mas dados estáticos não ensinam decisões dinâmicas. Modelos treinados dessa forma têm dificuldade com a natureza de longo prazo e orientada a objetivos das tarefas agenticas reais.
Essa nova pesquisa introduz o Nex-N1, um framework que escala sistematicamente a diversidade e complexidade dos ambientes de treinamento interativos, em vez de apenas escalar dados.
As capacidades do agente surgem da interação, não da imitação. Em vez de coletar mais demonstrações, eles construíram infraestrutura para gerar automaticamente arquiteturas e fluxos de trabalho diversos de agentes a partir de especificações em linguagem natural.
O sistema possui três componentes. NexAU (Agent Universe) fornece uma estrutura universal de agentes que gera hierarquias complexas de agentes a partir de configurações simples. O NexA4A (Agent for Agent) sintetiza automaticamente diversas arquiteturas de agentes a partir de linguagem natural. O NexGAP preenche a lacuna entre simulação e realidade ao integrar ferramentas MCP do mundo real para síntese de trajetórias fundamentadas.
Resultados:
- No banco τ2, o Nex-N1 baseado no DeepSeek-V3.1 tem 80,2, superando os 42,8 do modelo base.
- Na verificação do banco SWE, o Qwen3-32B-Nex-N1 alcança 50,5% contra 12,9% do modelo base.
- No BFCL v4 para uso em ferramentas, o Nex-N1 (65.3) supera o GPT-5 (61.6).
Em avaliações humanas sobre desenvolvimento de projetos no mundo real em 43 cenários de codificação, o Nex-N1 vence ou empata com Claude Sonnet 4,5 em 64,5% dos casos e com GPT-5 em ~70% dos casos.
Eles também construíram um agente de pesquisa profunda no Nex-N1, alcançando 47,0% no Deep Research Benchmark, com capacidades para geração visualizada de relatórios, incluindo slides e pôsteres de pesquisa.
Papel:

Melhores
Classificação
Favoritos

