ARGUMENTET FÖR MILJÖSKALNING // Miljöskalning kan vara lika viktigt som modellskalning för agentisk AI. Aktuell AI-forskning tyder på att det inte bara handlar om bättre resonemang att bygga en kraftfull agentisk AI-modell. Det handlar också om bättre miljöer. Standardmetoden för att träna kapabla AI-agenter idag är att samla in statiska banor eller mänskliga demonstrationer. Detta kräver mer data, fler exempel och mer annoteringsarbete. Men statisk data kan inte lära ut dynamiskt beslutsfattande. Modeller som tränats på detta sätt kämpar med den långsiktiga, målinriktade naturen hos verkliga agentiska uppgifter. Denna nya forskning introducerar Nex-N1, ett ramverk som systematiskt skalar upp mångfalden och komplexiteten i interaktiva träningsmiljöer istället för att bara skala data. Agentens förmågor uppstår ur interaktion, inte genom imitation. Istället för att samla in fler demonstrationer byggde de infrastruktur för att automatiskt generera olika agentarkitekturer och arbetsflöden från naturliga språkspecifikationer. Systemet har tre komponenter. NexAU (Agent Universe) tillhandahåller ett universellt agentramverk som genererar komplexa agenthierarkier från enkla konfigurationer. NexA4A (Agent for Agent) syntetiserar automatiskt olika agentarkitekturer från naturligt språk. NexGAP överbryggar simulerings-verklighetsklyftan genom att integrera verkliga MCP-verktyg för jordad trajektoriesyntes. Resultat: - På τ2-bänken får Nex-N1 byggd på DeepSeek-V3.1 80,2 poäng, vilket överträffar basmodellens 42,8. - På SWE-bench Verified uppnår Qwen3-32B-Nex-N1 50,5 % jämfört med basmodellens 12,9 %. - På BFCL v4 för verktygsanvändning överträffar Nex-N1 (65.3) GPT-5 (61.6). I mänskliga utvärderingar av verklig projektutveckling i 43 kodningsscenarier vinner eller delar Nex-N1 mot Claude Sonnet 4.5 i 64,5 % av fallen och mot GPT-5 i ~70 % av fallen. De byggde också en djupforskningsagent på Nex-N1, som uppnådde 47,0 % på Deep Research Benchmark, med möjligheter för visualiserad rapportgenerering, inklusive bilder och forskningsposters. Papper: