DiLoCo Suave: (@aaron_defazio et al) Alternativa não distribuída, com menos overhead de memória (apenas um buffer extra) e uma atualização contínua em vez da atualização externa periódica (bastante violenta) do clássico DiLoCo Curioso para ver expandido para distribuído!