Cyril e il team di CTGT stanno rendendo la interpretabilità meccanicistica un prodotto. Rendono possibile modificare il comportamento dei LLM per aggiungere garanzie di sicurezza senza dover riaddestrare, in un modo che è molto più affidabile rispetto a un semplice prompting.