Parece que outras pessoas convergem para usar vllm v1 logprob para a proporção de importância para corrigir o problema de estabilidade. Acho que tenho PTSD desse tipo de acidente de rl