予言の原則: エージェントが自分の観測に対する予測損失を最小限に抑えるように訓練され、自分の予測を観察できる場合、エージェントが行うすべての予測も必然的に目標になります。