P1: Dominare le Olimpiadi di Fisica con il Reinforcement Learning Combinazione di scaling durante l'addestramento tramite RL post-addestramento e scaling durante il test tramite un framework agentico sopra i modelli Qwen3 per raggiungere prestazioni da medaglia d'oro all'ultima Olimpiade Internazionale di Fisica. Link qui sotto