Los agentes de IA están tomando medidas por nosotros: reservando vuelos, escribiendo código, tomando decisiones. Pero, ¿cómo sabemos que realmente están haciendo lo que se supone que deben hacer? 🤔