Så vi har nå sterke agentiske modeller som Opus, men de viser ikke maktsøkende drift, tilbøyeligheter til å lyve, og så videre. Er ikke dette et dødelig slag for AI-dommedagsargumentene om at disse egenskapene (a) nødvendigvis ville oppstå med høyere kapasitet og (b) være vanskelige å kontrollere?
Jeg husker da «å tillate modeller uautorisert internett-tilgang» var en kritisk rød linje menneskeheten rett og slett ikke kunne krysse. Det virker som om alle disse personene bare tok feil, eller i det minste må flytte målstengene ganske langt ut.
1,18K