AI-agenter iverksetter tiltak for oss: bestiller flyreiser, skriver kode, tar beslutninger. Men hvordan vet vi at de faktisk gjør det de skal? 🤔