يعد نقل الوزن أحد أكبر الاختناقات عند إجراء RL الموزع على الطرز عالية السعة. تشرح مدونة Perplexity Research الأولى الخاصة بنا كيف سخر مهندسو الاستدلال في Perplexity اتصال RDMA من نقطة إلى نقطة لفتح تحديثات المعلمات فائقة السرعة لنماذج تريليون معلمة. من خلال تسخير أساسيات RDMA منخفضة المستوى والجدولة الثابتة وخطوط الأنابيب، نقوم بتسريع التحديثات بترتيب من حيث الحجم، إلى 1.3 ثانية فقط لكل تحديث.