RL é tão sensível a numéricos, da última vez que a compilação da tocha estava fazendo algum travamento de execução agora vllm v1