Cyril e a equipe da CTGT estão a transformar a interpretabilidade mecanicista em produto. Eles tornam possível editar o comportamento dos LLMs para adicionar garantias de políticas de segurança sem re-treinamento, de uma forma que é muito mais confiável do que simples prompts.