Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Kompresowanie sieci wyższych rzędów bez utraty tego, co ważne
Wiele rzeczywistych systemów nie składa się tylko z par linków. Grupa czatu, współautorski artykuł, klasa czy kompleks biochemiczny to interakcje grupowe obejmujące 3, 4 lub więcej podmiotów jednocześnie. Hipergrafy są naturalnym sposobem modelowania tego: umieszczasz węzły dla podmiotów i „hiper krawędzie” dla każdej grupy, z jedną warstwą dla par, inną dla trójek, inną dla czwórek i tak dalej. Problem polega na tym, że te modele wyższych rzędów szybko stają się ogromne, trudne do obliczenia i trudne do interpretacji. Kluczowe pytanie brzmi: ile z tej struktury wyższego rzędu to naprawdę nowa informacja, a ile to tylko redundancja w niższych rzędach? 
Alec Kirkley, Helcio Felippe i Federico Battiston zajmują się tym za pomocą teoretycznej koncepcji redukowalności strukturalnej dla hipergrafów. Pomyśl o próbie przesłania całej sieci wyższego rzędu przez bardzo kosztowny link danych. Jedną z opcji jest „naiwna”: wysłać każdą warstwę (pary, trójki, 4-uple, …) niezależnie. Ich alternatywa jest mądrzejsza: wysłać tylko mały zestaw „reprezentatywnych” warstw, a następnie opisać pozostałe jako hałaśliwe kopie tych, używając tylko różnic. Im więcej nakładającej się struktury jest między rzędami (na przykład, gdy wszystkie interakcje 2- i 3-ciałowe są już implikowane przez te 5-ciałowe), tym więcej można skompresować.
Przekształcają to w znormalizowany wskaźnik η między 0 (brak kompresji) a 1 (idealnie zagnieżdżony, w pełni redukowalny) oraz explicite zredukowany model, który zachowuje tylko nie-redundantne rozmiary interakcji. Rysunki w artykule pokazują proste przykłady, w których hipergraf czterowarstwowy można optymalnie zredukować do zaledwie dwóch warstw, jednocześnie uchwytując istotną organizację wyższego rzędu. 
Następnie testują to na danych syntetycznych i rzeczywistych. Na kontrolowanych „zagnieżdżonych” hipergrafach zabawkowych, η płynnie maleje, gdy wprowadzają losowość — zachowując się jak pokrętło od „idealnie ustrukturyzowanego” do „w pełni losowego”. W rzeczywistych systemach (współautorstwo, sieci kontaktowe, wątki e-mailowe, systemy tagowania itp.) wiele okazuje się być zaskakująco kompresyjnych: można pominąć kilka rzędów hiper krawędzi i zachować tylko mały podzbiór warstw, a mimo to zachować globalną łączność, strukturę społeczności, a nawet zachowanie dynamiki modelu głosowania wyższego rzędu na szczycie sieci. 
Wniosek: często nie potrzebujesz pełnego, nieporęcznego opisu wyższego rzędu, aby badać złożony system. Z odpowiednią teoretyczną perspektywą informacyjną możesz zidentyfikować, które rozmiary grup rzeczywiście dodają nową strukturę, zbudować znacznie mniejszy hipergraf i nadal wiernie uchwycić zbiorowe wzorce i dynamikę, które są dla Ciebie ważne. 
Artykuł:

Najlepsze
Ranking
Ulubione
