AI-agenten ondernemen acties voor ons: vluchten boeken, code schrijven, beslissingen nemen. Maar hoe weten we dat ze daadwerkelijk doen wat ze moeten doen? 🤔