Penalidades de complexidade significam que a estratégia ideal para um determinado jogo não pode ter profundidade de recursão ilimitada, a menos que seja otimizada para chamada de cauda ou produza recompensas exponenciais. Cada divisão recursiva adiciona pelo menos um pouco de complexidade ao modelo desenrolado no tempo de uma estratégia.
A maioria das teorias dos jogos que vi não lida com as implicações disso. É um limite diferente do mero custo computacional. O custo da computação pode ser precificado localmente, mas a complexidade é um limite global. O contexto é importante.
(Se você conhece a teoria dos jogos considerando o comportamento desenrolado do jogador como um modelo cuja precisão e complexidade devem ser equilibradas, por favor me avise! Eu olhei e não encontrei, mas isso não significa que usei as palavras-chave corretas ...)
Isso diz que a estratégia ideal para um jogador é determinada em relação ao modelo próprio do jogador. Se você se modelar como escolhendo duas opções sob uma certa condição, a árvore desenrolada cresce. Mas se você arredondar para zero, a árvore não ganhará um novo ramo.
Com efeito, existe um "orçamento de decisão". Adicionar decisões mais refinadas aqui significa que você precisa tomar decisões menos refinadas em outro lugar. Não menos computação, mas menos decisões. Ou, dito de outra forma, esse é o custo complexo das opções não tomadas.
O equivalente a "computação mais barata" aqui é "melhores antecedentes de fundo". Quantas decisões você está tomando é a divergência entre seu comportamento com base no estado neste momento, versus seu comportamento se fosse (seu modelo de) o momento médio da experiência. Bons hábitos!
Isso é como um espelho de conhecimento comum ... são ações comuns. As ações passadas habituais de um agente restringem suas ações ótimas futuras. O que significa, em certo sentido, que apenas agir de alguma forma é um pré-compromisso credível de continuar a estratégia implícita.
A menos, é claro, que o jogador esteja agindo de forma enganosa - pagando um custo de complexidade surpreendentemente alto para se modelar como geralmente agindo de outra maneira, a fim de manter um antecedente diferente, porque espera lucro traindo aqueles enganados mais tarde.
As estratégias ideais são robustamente ótimas. Uma estratégia ótima com maior retorno esperado que leva à ruína não é a ideal. A robustez depende da simplicidade, que é relativa à teoria da mente do eu, do outro e do "nós" coletivo.
Essas regras sobre decisões ótimas sob incerteza não são sugestões, são leis da mesma forma que as atualizações bayesianas. O que você sabe de si mesmo é causal sobre sua estratégia ideal, e há um custo inevitável de complexidade para o engano que vincula o automodelo à realidade.
4,31K