私たちの新しい実験は、Gemini 2.5 Deep Thinkの高度なバージョンを用いて、理論的なコンピュータサイエンスの論文を厳密に検証します。試験参加者の97%(#STOC2026 の著者)は、フィードバックが誤りの発見や明確さの向上に役立つと感じています。詳細はこちら: