Dit DeepMind-onderzoek heeft stilletjes de meest troostende leugen in AI-veiligheid ontmaskerd. Het idee dat veiligheid gaat over hoe modellen zich meestal gedragen, klinkt redelijk. Het is ook verkeerd op het moment dat systemen opschalen. DeepMind toont aan waarom gemiddelden irrelevant worden wanneer de implementatie miljoenen interacties bereikt. Het artikel herformuleert AGI-veiligheid als een distributieprobleem. Wat belangrijk is, is niet het typische gedrag. Het is de staart. Zeldzame fouten. Randgevallen. Laag-probabiliteitsevents die in tests verwaarloosbaar lijken, maar in de echte wereld onvermijdelijk worden. Benchmarks, red-teaming en demo's nemen allemaal monsters uit het midden. Implementatie monsters alles. Vreemde gebruikers, vreemde prikkels, vijandige feedbackloops, omgevingen waar niemand voor heeft gepland. Op schaal stoppen die gevallen met zeldzaam zijn. Ze zijn gegarandeerd. Hier is de ongemakkelijke inzicht: vooruitgang kan systemen veiliger laten lijken terwijl ze stilletjes gevaarlijker worden. Als de capaciteit sneller groeit dan de controle over de staart, nemen zichtbare fouten af terwijl catastrofale risico's zich buiten beeld opstapelen. Twee modellen kunnen gemiddeld identiek lijken en toch wild verschillen in het slechtste geval gedrag. Huidige evaluaties kunnen die kloof niet zien. Governance-structuren gaan ervan uit dat ze dat kunnen. Je kunt veiligheid niet certificeren met eindige tests wanneer het risico in distributieverschuiving ligt. Je test nooit het systeem dat je daadwerkelijk implementeert. Je monster een toekomst die je niet controleert. Dat is de echte clou. AGI-veiligheid is geen modelattribuut. Het is een systeemprobleem. Implementatiecontext, prikkels, monitoring en hoeveel staatrisk de samenleving tolereert, zijn allemaal belangrijker dan schone gemiddelden. Dit artikel stelt niet gerust. Het verwijdert de illusie. De vraag is niet of het model meestal goed presteert. Het is wat er gebeurt wanneer het dat niet doet - en hoe vaak dat is toegestaan voordat schaal het onaanvaardbaar maakt. Artikel: