Vårt nye eksperiment bruker en avansert versjon av Gemini 2.5 Deep Think for å grundig verifisere teoretiske informatikkartikler. 97 % av deltakerne, forfattere for #STOC2026, syntes tilbakemeldingen var nyttig for å oppdage feil og forbedre klarheten. Mer på: