Spouštím svůj benchmark "SVG kočky jedoucí na drakovi". (inspirováno @simonw Pelican Riding Bicycle Benchmark) Claude Opus 4.5 dělá z Gemini 3 Pro a GPT 5.1 Pro a Grok 4.1 hračky.
Nemůžu uvěřit, že GPT 5.1 Pro přemýšlel o 7m 40s na tohle 🤣
Začínám pochybovat o hodnotě tohoto benchmarku, SVG se pokaždé hodně mění! Další pokus a Gemini 3 Pro vytvořil překvapivě roztomilého anime draka.
3,87K