Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Сжатие высших порядков сетей без потери важного
Многие реальные системы состоят не только из парных связей. Групповой чат, совместно написанная статья, класс или биохимический комплекс — это групповые взаимодействия, в которых участвуют 3, 4 или более сущностей одновременно. Гиперграфы — это естественный способ моделирования этого: вы ставите узлы для сущностей и «гиперребра» для каждой группы, с одним слоем для пар, другим для троек, другим для четверок и так далее. Загвоздка в том, что эти модели высшего порядка быстро становятся огромными, с ними трудно работать и их трудно интерпретировать. Ключевой вопрос: сколько из этой структуры высшего порядка действительно является новой информацией, а сколько просто избыточно по сравнению с более низкими порядками? 
Алек Киркли, Хелсио Фелиппе и Федерико Баттистон решают эту задачу с помощью информационно-теоретической концепции структурной редукции для гиперграфов. Подумайте о том, как отправить целую сеть высшего порядка по очень дорогой каналу передачи данных. Один из вариантов — «наивный»: отправить каждый слой (пары, тройки, 4-ки и т. д.) независимо. Их альтернатива более умная: отправить только небольшой набор «представительных» слоев, а затем описать оставшиеся как шумные копии этих, используя только различия. Чем больше перекрывающейся структуры между порядками (например, когда все взаимодействия 2- и 3- тел уже подразумеваются 5- телами), тем больше вы можете сжать.
Они превращают это в нормализованный балл η от 0 (нет сжимаемости) до 1 (совершенно вложенный, полностью редуцируемый) и явную сокращенную модель, которая сохраняет только не избыточные размеры взаимодействий. Рисунки в статье показывают простые примеры, где четырехслойный гиперграф можно оптимально сократить до всего лишь двух слоев, при этом сохраняя основную организацию высшего порядка. 
Затем они подвергают это стресс-тестированию на синтетических и реальных данных. На контролируемых «вложенных» игрушечных гиперграфах η плавно уменьшается по мере введения случайности — ведя себя как регулятор от «совершенно структурированного» до «полностью случайного». В реальных системах (соавторство, контактные сети, электронные переписки, системы тегирования и т. д.) многие оказываются удивительно сжимаемыми: вы можете убрать несколько порядков гиперребер и оставить только небольшой подмножество слоев, сохраняя при этом глобальную связанность, структуру сообществ и даже поведение динамики высшего порядка модели голосования на вершине сети. 
Вывод: вам часто не нужно полное, громоздкое описание высшего порядка, чтобы изучить сложную систему. С правильной информационно-теоретической точки зрения вы можете определить, какие размеры групп действительно добавляют новую структуру, построить гораздо меньший гиперграф и при этом точно захватить коллективные паттерны и динамику, которые вам важны. 
Статья:

Топ
Рейтинг
Избранное
