Para agentes de conversação, o usuário é o ambiente. Pode-se considerar cada conversa como uma implementação de uma política que direciona o usuário para o objetivo do modelo.