Gli agenti AI stanno compiendo azioni per noi: prenotare voli, scrivere codice, prendere decisioni. Ma come possiamo sapere che stanno effettivamente facendo ciò che dovrebbero? 🤔