Ich starte mein „SVG eines Katers, der auf einem Drachen reitet“ Benchmark. (inspiriert von @simonw's Benchmark mit dem Pelikan auf dem Fahrrad) Claude Opus 4.5 lässt Gemini 3 Pro & GPT 5.1 Pro & Grok 4.1 wie Spielzeuge aussehen.
Kann nicht glauben, dass GPT 5.1 Pro 7 Minuten und 40 Sekunden für diesen Mist nachgedacht hat 🤣
Ich beginne, den Wert dieses Benchmarks in Frage zu stellen, das SVG ändert sich jedes Mal, wenn ich es ausführe! Ein weiterer Versuch und Gemini 3 Pro hat diesen überraschend niedlichen Anime-Stil Drachen generiert.
3,87K