Перенесення ваги є одним з найбільших вузьких місць при виконанні розподіленого RL на моделях великої місткості. У нашому першому блозі Perplexity Research пояснюється, як інженери Perplexity використовували зв'язок RDMA «точка-точка» для розблокування надшвидкого оновлення параметрів для моделей із трильйонами параметрів. Використовуючи низькорівневі примітиви RDMA, статичне планування та конвеєр, ми прискорюємо оновлення на порядок, лише до 1,3 секунди за оновлення.