Comprimindo redes de ordem superior sem perder o que importa Muitos sistemas reais não são feitos apenas de ligações par a par. Um grupo de chat, um artigo coautorado, uma sala de aula ou um complexo bioquímico são interações de grupo envolvendo 3, 4 ou mais entidades ao mesmo tempo. Hipergrafos são a forma natural de modelar isso: você coloca nós para as entidades e "hiperarestas" para cada grupo, com uma camada para pares, outra para trios, outra para quádruplos, e assim por diante. O problema: esses modelos de ordem superior rapidamente se tornam enormes, difíceis de calcular e difíceis de interpretar. A questão chave é: quanto dessa estrutura de ordem superior é realmente nova informação, e quanto é apenas redundante com ordens inferiores?  Alec Kirkley, Helcio Felippe e Federico Battiston abordam isso com uma noção de teorias da informação de reduzibilidade estrutural para hipergrafos. Pense em tentar enviar uma rede inteira de ordem superior por um link de dados muito caro. Uma opção é "ingênua": enviar cada camada (pares, trios, 4-tuplas, …) de forma independente. A alternativa deles é mais inteligente: enviar apenas um pequeno conjunto de camadas "representativas", e depois descrever as restantes como cópias ruidosas dessas, usando apenas as diferenças. Quanto mais estrutura sobreposta houver entre as ordens (por exemplo, quando todas as interações de 2 e 3 corpos já estão implícitas nas de 5 corpos), mais você pode comprimir. Eles transformam isso em uma pontuação normalizada η entre 0 (sem compressibilidade) e 1 (perfeitamente aninhado, totalmente redutível), e um modelo reduzido explícito que mantém apenas os tamanhos de interação não redundantes. Figuras no artigo mostram exemplos simples onde um hipergrafo de quatro camadas pode ser reduzido de forma otimizada para apenas duas camadas, enquanto ainda captura a organização essencial de ordem superior.  Eles então testam isso em dados sintéticos e reais. Em hipergrafos de brinquedo "aninhados" controlados, η diminui suavemente à medida que injetam aleatoriedade—comportando-se como um botão de "perfeitamente estruturado" a "totalmente aleatório". Em sistemas reais (coautoria, redes de contato, threads de e-mail, sistemas de etiquetagem, etc.), muitos se revelam surpreendentemente compressíveis: você pode descartar várias ordens de hiperarestas e manter apenas um pequeno subconjunto de camadas, ainda assim preservando a conectividade global, a estrutura da comunidade e até mesmo o comportamento das dinâmicas de modelo de votante de ordem superior em cima da rede.  A conclusão: muitas vezes você não precisa da descrição completa e pesada de ordem superior para estudar um sistema complexo. Com a lente teórica da informação certa, você pode identificar quais tamanhos de grupo realmente adicionam nova estrutura, construir um hipergrafo muito menor e ainda capturar fielmente os padrões coletivos e dinâmicas que você se importa.  Artigo: