O nosso novo experimento utiliza uma versão avançada do Gemini 2.5 Deep Think para verificar rigorosamente artigos de ciência da computação teórica. 97% dos participantes do teste, autores do #STOC2026, acharam o feedback útil para detectar erros e melhorar a clareza. Mais em: