Transfer berat adalah salah satu hambatan terbesar saat melakukan RL terdistribusi pada model berkapasitas tinggi. Blog Perplexity Research pertama kami menjelaskan bagaimana insinyur inferensi Perplexity memanfaatkan komunikasi point-to-point RDMA untuk membuka pembaruan parameter ultra-cepat untuk model triliunan parameter. Dengan memanfaatkan primitif RDMA tingkat rendah, penjadwalan statis, dan pipelining, kami mempercepat pembaruan dengan urutan besarnya, menjadi hanya 1,3 detik per pembaruan.