DeepSeek V3.2 - a atenção esparsa resolve o contexto longo e diminui os custos de inferência por fator grande. Ainda estou esperando pela V4, mas as otimizações já na V3.1 e V3.2 são impressionantes.