Запускаю свой бенчмарк "SVG кота, едущего на драконе". (вдохновлено бенчмарком @simonw о пеликане, едущем на велосипеде) Claude Opus 4.5 заставляет Gemini 3 Pro и GPT 5.1 Pro и Grok 4.1 выглядеть как игрушки.
Не могу поверить, что GPT 5.1 Pro думал 7 минут 40 секунд над этой ерундой 🤣
Я начинаю сомневаться в ценности этого бенчмарка, SVG каждый раз сильно меняется, когда я его запускаю! Еще одна попытка, и Gemini 3 Pro сгенерировал этого удивительно милого дракона в аниме-стиле.
3,88K