Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Na minha opinião, a conclusão mais importante deste resultado é que o nosso modelo de ouro da @OpenAI International Math Olympiad (IMO) é também o nosso melhor modelo de codificação competitiva. 🧵

12/08, 02:00
1/n Estou entusiasmado por compartilhar que o nosso sistema de raciocínio @OpenAI obteve uma pontuação alta o suficiente para conquistar o ouro 🥇🥇 em uma das principais competições de programação do mundo - a Olimpíada Internacional de Informática de 2025 (IOI) - ficando em primeiro lugar entre os participantes de IA! 👨💻👨💻

Após o IMO, realizámos avaliações completas do modelo de ouro do IMO e descobrimos que, além da matemática competitiva, era também o nosso melhor modelo em muitas outras áreas, incluindo codificação. Assim, o pessoal decidiu pegar exatamente no mesmo modelo de ouro do IMO, sem quaisquer alterações, e usá-lo no sistema para o IOI.
O andaime IOI envolveu a amostragem de alguns modelos diferentes e, em seguida, a utilização de outro modelo e uma heurística para selecionar soluções para submissão. Este sistema alcançou uma medalha de ouro, classificando-se em 6º lugar entre os humanos. O modelo de ouro do IMO realmente teve o melhor desempenho entre todos os modelos que amostramos.
Para ser claro, este sistema usou andaimes, embora um andaime mais leve do que o do ano passado. Ele apenas decidiu quais amostras de modelos de uso geral submeter. Estou otimista de que no próximo ano nos sentiremos confiantes de que o modelo em si pode fazer melhor do que qualquer andaime que pudéssemos criar.
Não estive envolvido neste trabalho. Grandes parabéns a @sherylhsu02, @alexwei_, @bminaiev e oleg murk, assim como a @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky, e muitos outros por este resultado!
155,91K
Top
Classificação
Favoritos