Запускаю свій бенчмарк «SVG кота, що їде на драконі». (натхненний еталоном @simonw з катання велосипеда на пеліканах) Claude Opus 4.5 робить Gemini 3 Pro, GPT 5.1 Pro і Grok 4.1 схожими на іграшки.
Не можу повірити, що GPT 5.1 Pro думав про 7 хвилин 40 секунд для цього 🤣 лайна
Я починаю сумніватися в цінності цього бенчмарку, SVG сильно змінюється щоразу, коли я його запускаю! Ще одна спроба — і Gemini 3 Pro створила цього несподівано милого дракона в аніме.
3,86K