DeepSeek V3.2: la atención dispersa resuelve el contexto largo y disminuye los costos de inferencia por un factor grande. Todavía estoy esperando la V4, pero las optimizaciones que ya están en la V3.1 y la V3.2 son impresionantes.