重量移動は、大容量モデルで分散 RL を実行する際の最大のボトルネックの 1 つです。 最初のPerplexity Researchブログでは、Perplexityの推論エンジニアがRDMAポイントツーポイント通信を活用して、1兆のパラメータモデルの超高速パラメータ更新を実現した方法を説明しています。 低レベルのRDMAプリミティブ、静的スケジューリング、パイプラインを活用することで、更新を桁違いに高速化し、更新ごとにわずか1.3秒に短縮します。