Cyril og teamet hos CTGT gjør mekanistisk tolkbarhet til et produkt. De gjør det mulig å redigere oppførselen til LLM-er for å legge til sikkerhetspolicygarantier uten omtrening, på en måte som er mye mer pålitelig enn enkel prompting.