预言原则:如果一个代理被训练以最小化其自身观察的预测损失,并且它可以观察自己的预测,那么它所做的每一个预测必然也会成为一个目标。