对于对话代理而言,用户就是环境。可以将每次对话视为一种策略的展开,该策略引导用户朝向模型的目标。