Agen AI mengambil tindakan untuk kami: memesan penerbangan, menulis kode, membuat keputusan. Tapi bagaimana kita tahu mereka benar-benar melakukan apa yang seharusnya? 🤔