啟動我的「貓騎龍的SVG」基準測試。 (靈感來自@simonw的鵝騎自行車基準測試) Claude Opus 4.5 讓 Gemini 3 Pro 和 GPT 5.1 Pro 以及 Grok 4.1 看起來像玩具。
真不敢相信 GPT 5.1 Pro 為這個東西想了 7 分 40 秒 🤣
我開始質疑這個基準的價值,每次運行時SVG都變化很大! 另一個嘗試,Gemini 3 Pro生成了這隻意外可愛的動漫風格龍。
3.86K