Fajny artykuł od Meta. I kolejna doskonała aplikacja systemów wieloagentowych. (zapisz to) Szkolenie nowoczesnych modeli AI wymaga ogromnych ilości danych wysokiej jakości. Jednak wąskim gardłem nie jest tylko ilość. Dane po prostu nie są wystarczająco zróżnicowane. Pojedyncze modele generujące dane syntetyczne mają tendencję do produkowania jednorodnych wyników, powtarzających się wzorców i braku zniuansowanej różnorodności, którą można znaleźć w zbiorach danych stworzonych przez ludzi. Nowe badania od Meta wprowadzają Matrix, ramy peer-to-peer, w których wiele agentów AI współpracuje w celu generowania syntetycznych danych treningowych poprzez zdecentralizowane interakcje. Matrix osiąga 2–15× wyższą przepustowość generowania danych przy identycznych zasobach sprzętowych, nie kompromitując jakości wyników. TL;DR: Zamiast jednego modelu produkującego dane, wyspecjalizowane agenty odgrywają różne role i komunikują się ze sobą. Jeden zadaje pytania, inny odpowiada, a trzeci ocenia jakość. Te wieloetapowe rozmowy uchwycają złożone rozumowanie i różnorodne perspektywy. Co sprawia, że Matrix jest inny: brak centralnego koordynatora. Agenci komunikują się bezpośrednio w całkowicie zdecentralizowanej architekturze. Umożliwia to skalowalność bez wąskich gardeł infrastrukturalnych. Ramy działają poprzez protokoły rozmów oparte na rolach, wzorce interakcji wieloetapowych oraz wbudowane filtrowanie jakości na każdym etapie. Tylko dane spełniające progi jakości trafiają do ostatecznego zbioru treningowego. Współpraca wieloagentowa produkuje bardziej zróżnicowane dane syntetyczne niż podejścia oparte na pojedynczym modelu. Powstałe zbiory danych poprawiają wydajność modeli w benchmarkach rozumowania i przestrzegania instrukcji.