启动我的“猫骑龙的SVG”基准测试。 (灵感来自@simonw的骑自行车的鹈鹕基准测试) Claude Opus 4.5让Gemini 3 Pro和GPT 5.1 Pro以及Grok 4.1看起来像玩具。
真不敢相信 GPT 5.1 Pro 为这玩意儿思考了 7 分 40 秒 🤣
我开始质疑这个基准的价值,每次运行时SVG变化都很大! 又一次尝试,Gemini 3 Pro生成了这只意外可爱的动漫风格龙。
3.87K