🔒Hur kan vi förhindra skada från AI-system som strävar efter oavsiktliga mål? AI-kontroll är en lovande forskningsagenda som försöker ta itu med denna kritiska fråga. Idag är vi glada över att lansera ControlArena – vårt bibliotek för att köra säkra och reproducerbara AI-kontrollexperiment🧵