Přenos hmotnosti je jedním z největších úzkých míst při provádění distribuovaného RL na vysokokapacitních modelech. Náš první blog Perplexity Research vysvětluje, jak inferenční inženýři společnosti Perplexity využili point-to-point komunikaci RDMA k odemknutí ultra rychlých aktualizací parametrů pro modely s biliony parametrů. Využitím nízkoúrovňových primitiv RDMA, statického plánování a zřetězení zrychlujeme aktualizace o řád, na pouhých 1,3 sekundy na aktualizaci.