一位前 Google DeepMind 的研究科學家基本上在大聲說出許多工程師現在的感受。Gemini 3 是一個不錯的網頁開發助手,但在真正的編碼方面,它常常感覺過於適應基準測試,而不是實際工作。 在演示中表現出色,但在實際工作中卻顯得不穩定。