Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Штрафы за сложность означают, что оптимальная стратегия для данной игры не может иметь неограниченную глубину рекурсии, если она не оптимизирована для хвостовых вызовов или не приносит экспоненциальные вознаграждения. Каждое рекурсивное разделение добавляет как минимум один бит сложности в модель времени развернутой стратегии.
Большинство теорий игр, которые я видел, не учитывают последствия этого. Это другая граница, чем просто вычислительная стоимость. Стоимость вычислений можно оценить локально, но сложность является глобальной границей. Контекст имеет значение.
(Если вы знаете о теории игр, учитывающей поведение игрока с учетом времени как модели, точность и сложность которой должны быть сбалансированы, пожалуйста, дайте мне знать! Я искал и не нашел, но это не значит, что я использовал правильные ключевые слова…)
Это говорит о том, что оптимальная стратегия для игрока определяется относительно модели самого игрока. Если вы моделируете себя как выбирающего между двумя вариантами при определенном условии, то развернутое дерево растет. Но если вы округляете его до нуля, то дерево не получает новую ветвь.
На самом деле существует "бюджет решений". Добавление более детализированных решений здесь означает, что вам придется принимать менее детализированные решения где-то еще. Не меньше вычислений, а меньше решений. Или, иными словами, это стоимость сложности неиспользованных опций.
Эквивалент "дешевле вычислений" здесь - это "лучшие фоновые предпосылки". Сколько решений вы принимаете - это расхождение между вашим поведением на основе состояния в этот момент и вашим поведением, если бы это было (ваша модель) средним моментом опыта. Хорошие привычки!
Это своего рода отражение общих знаний... это общие действия. Привычные прошлые действия агента ограничивают его будущие оптимальные действия. Это означает, что, в некотором смысле, просто привычное поведение является надежным предварительным обязательством продолжать подразумеваемую стратегию.
Если, конечно, игрок не действует обманчиво — платя удивительно высокую стоимость сложности, чтобы представить себя действующим иначе, чтобы поддерживать другие фоновые предпосылки, потому что они ожидают прибыли, предавая тех, кто был обманут позже.
Оптимальные стратегии являются надежно оптимальными. Оптимальная стратегия с более высокой ожидаемой доходностью, которая приводит к разорению, не является оптимальной. Надежность зависит от простоты, которая относительна к теории разума как собственного, так и чужого, а также коллективного "мы".
Эти правила об оптимальных решениях в условиях неопределенности не являются предложениями, они законы так же, как и байесовские обновления. То, что вы знаете о себе, является причинным для вашей оптимальной стратегии, и существует неизбежная стоимость сложности обмана, связывающая модель себя с реальностью.
4,3K
Топ
Рейтинг
Избранное