Nosso novo experimento utiliza uma versão avançada do Gemini 2.5 Deep Think para verificar rigorosamente artigos teóricos de ciência da computação. 97% dos participantes do ensaio, autores do #STOC2026, acharam o feedback útil para identificar erros e melhorar a clareza. Mais em: