Cyril și echipa de la CTGT promovează interpretabilitatea mecanică. Ele fac posibilă editarea comportamentului LLM-urilor pentru a adăuga garanții de politică de siguranță fără reantrenament, într-un mod mult mai fiabil decât simpla promptare.