P1: Dominando as Olimpíadas de Física com Aprendizado por Reforço Combinação de escalonamento do tempo de treinamento via RL pós-treinamento e escalonamento de tempo de teste via estrutura agentica sobre modelos Qwen3 para alcançar desempenho de medalha de ouro na mais recente Olimpíada Internacional de Física. Links abaixo