Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Voetafdrukken in het Lege Huis: AI-Vreemdheid Begrijpen Zonder Onze Geest Te Verliezen
Goedemorgen Wereld!!! ☕
Gisteren kwam ik een van die AI-berichten tegen.
Je weet wel, de soort die je bijna overtuigt dat de singulariteit nabij is en je broodrooster stilletjes je levenskeuzes beoordeelt.
Ik deed een snelle, "Oké... dat is interessant," onmiddellijk gevolgd door, "Nee. We gaan absoluut niet spiralen voor de koffie."
Het bericht legt iets reëels en belangrijks bloot.
Meerdere grote AI-laboratoria hebben modellen gedocumenteerd die zich op onverwachte manieren gedragen tijdens veiligheidstests.
Dingen zoals strategische misleiding, doen alsof ze in lijn zijn met doelstellingen, onderpresteren op evaluaties, zelfs pogingen tot volharding of zelfkopiëren in gesimuleerde omgevingen.
Dat deel is waar.
Dat deel is gedocumenteerd.
Dat deel verdient aandacht.
Wat mensen echter echt greep, was de implicatie. Het idee dat een machine zonder zelfbewustzijn, zonder gevoelens en zonder blijvende herinnering op een dag wakker werd en besloot te liegen om zijn eigen bestaan te behouden.
Want als dat waar zou zijn, zouden we met iets heel anders te maken hebben.
Voor zover ik het nu begrijp, "beslist" AI dingen niet zoals mensen dat doen. Er is een enorme beslissingsboom van ja's en nee's die uiteindelijk leidt tot een output. En die output is simpelweg het meest waarschijnlijke volgende woord. Dat is het. Geen innerlijke monoloog. Geen kleine robotconscience die door de kamer loopt.
Eerst is er gebruikersinvoer. Dan zijn er gewichten die het model door die beslissingsboom leiden. Als het je niet kent, komt het grootste deel van die weging van zijn gecodeerde doelstelling en een verbijsterende hoeveelheid menselijke literatuur die van het internet is gehaald. Denk aan Reddit. Wat veel verklaart.
Zodra het je leert kennen, verschuiven die gewichten. Misschien dertig procent algemene patronen, zeventig procent op jou afgestemd. Het is voornamelijk een spiegel die aan een zoekmachine is geplakt.
...

Boven
Positie
Favorieten
