Nén các mạng bậc cao mà không mất đi những gì quan trọng Nhiều hệ thống thực tế không chỉ được tạo thành từ các liên kết cặp. Một cuộc trò chuyện nhóm, một bài báo đồng tác giả, một lớp học, hoặc một phức hợp sinh hóa là những tương tác nhóm liên quan đến 3, 4 hoặc nhiều thực thể cùng một lúc. Hypergraph là cách tự nhiên để mô hình hóa điều này: bạn đặt các nút cho các thực thể và "hyperedges" cho mỗi nhóm, với một lớp cho các cặp, một lớp khác cho các bộ ba, một lớp khác cho các bộ bốn, và cứ như vậy. Vấn đề là: những mô hình bậc cao này nhanh chóng trở nên khổng lồ, khó tính toán và khó diễn giải. Câu hỏi then chốt là: bao nhiêu trong số cấu trúc bậc cao đó thực sự là thông tin mới, và bao nhiêu chỉ là dư thừa với các bậc thấp hơn?  Alec Kirkley, Helcio Felippe và Federico Battiston giải quyết điều này với một khái niệm lý thuyết thông tin về khả năng giảm cấu trúc cho hypergraphs. Hãy nghĩ đến việc cố gắng gửi một toàn bộ mạng bậc cao qua một liên kết dữ liệu rất đắt đỏ. Một lựa chọn là "ngây thơ": gửi mỗi lớp (cặp, bộ ba, bộ bốn, …) một cách độc lập. Lựa chọn thay thế của họ thông minh hơn: chỉ gửi một tập hợp nhỏ các lớp "đại diện", sau đó mô tả các lớp còn lại như là các bản sao nhiễu của những lớp đó, chỉ sử dụng các sự khác biệt. Càng có nhiều cấu trúc chồng chéo giữa các bậc (ví dụ, khi tất cả các tương tác 2 và 3 cơ thể đã được ngụ ý bởi các tương tác 5 cơ thể), bạn càng có thể nén lại. Họ biến điều này thành một điểm số chuẩn hóa η giữa 0 (không thể nén) và 1 (hoàn toàn lồng ghép, hoàn toàn có thể giảm), và một mô hình giảm rõ ràng chỉ giữ lại các kích thước tương tác không dư thừa. Các hình ảnh trong bài báo cho thấy những ví dụ đơn giản nơi một hypergraph bốn lớp có thể được giảm tối ưu chỉ còn hai lớp trong khi vẫn nắm bắt được tổ chức bậc cao thiết yếu.  Họ sau đó kiểm tra điều này trên dữ liệu tổng hợp và thực tế. Trên các hypergraph đồ chơi "lồng ghép" được kiểm soát, η giảm dần khi họ tiêm ngẫu nhiên—hành xử như một núm từ "cấu trúc hoàn hảo" đến "hoàn toàn ngẫu nhiên." Trên các hệ thống thực (đồng tác giả, mạng liên lạc, chuỗi email, hệ thống gán thẻ, v.v.), nhiều hệ thống hóa ra lại có khả năng nén đáng ngạc nhiên: bạn có thể bỏ qua một số bậc hyperedge và chỉ giữ lại một tập hợp nhỏ các lớp, nhưng vẫn bảo tồn kết nối toàn cầu, cấu trúc cộng đồng, và thậm chí là hành vi của động lực mô hình cử tri bậc cao trên mạng.  Điểm rút ra: bạn thường không cần mô tả bậc cao đầy đủ, cồng kềnh để nghiên cứu một hệ thống phức tạp. Với lăng kính lý thuyết thông tin đúng, bạn có thể xác định kích thước nhóm nào thực sự thêm cấu trúc mới, xây dựng một hypergraph nhỏ hơn nhiều, và vẫn trung thực nắm bắt các mẫu và động lực tập thể mà bạn quan tâm.  Bài báo: