Enligt min mening är den viktigaste behållningen från detta resultat att vår @OpenAI International Math Olympiad (IMO) guldmodell också är vår bästa konkurrenskraftiga kodningsmodell. 🧵
Sheryl Hsu
Sheryl Hsu12 aug. 2025
1/n Jag är glad över att kunna dela med mig av att vårt @OpenAI resonemangssystem fick tillräckligt höga poäng för att uppnå guld 🥇🥇 i en av världens främsta programmeringstävlingar - 2025 International Olympiad in Informatics (IOI) - och placerade sig först bland AI-deltagarna! 👨‍💻👨‍💻
Efter IMO körde vi fullständiga utvärderingar på IMO:s guldmodell och fann att bortsett från bara konkurrenskraftig matematik var det också vår bästa modell på många andra områden, inklusive kodning. Så folk bestämde sig för att ta exakt samma IMO-guldmodell, utan några ändringar, och använda den i systemet för IOI.
IOI-ställningen innebar att man tog prover från några olika modeller och sedan använde en annan modell och en heuristik för att välja lösningar för inlämning. Detta system uppnådde en guldmedalj och placerade sig på 6:e plats bland människor. IMO:s guldmodell klarade sig verkligen bäst av alla modeller vi provade från.
För att vara tydlig använde detta system ställningar, även om det var en lättare ställning än förra året. Den beslutade bara vilka prover från allmänna modeller som skulle lämnas in. Jag är optimistisk och tror att vi nästa år kommer att känna oss säkra på att modellen i sig kan göra bättre ifrån sig än någon annan ställning vi kan komma på.
Jag var inte inblandad i detta arbete. Stort grattis till @sherylhsu02, @alexwei_, @bminaiev och oleg murk, samt @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky och många många andra för detta resultat!
156K