P1 : Maîtriser les Olympiades de Physique avec l'Apprentissage par Renforcement Combinaison de l'échelle de temps d'entraînement via l'AR après l'entraînement et de l'échelle de temps de test via un cadre agentique sur les modèles Qwen3 pour atteindre des performances de médaille d'or lors de la dernière Olympiade Internationale de Physique. Liens ci-dessous