Nuestro nuevo experimento utiliza una versión avanzada de Gemini 2.5 Deep Think para verificar rigurosamente artículos teóricos de informática. El 97% de los participantes en el ensayo, autores de #STOC2026, encontraron útil la retroalimentación para detectar errores y mejorar la claridad. Más en: