DiLoCo suave: (@aaron_defazio et al) Alternativa no distribuida, con menos sobrecarga de memoria (solo un búfer extra) y una actualización continua en lugar de la actualización periódica (bastante violenta) externa del clásico DiLoCo ¡Tengo curiosidad por ver cómo se expande a distribuido!