Es ist verrückt, wie schnell wir die Benchmarks für jede Modalität gesättigt haben. Es war ziemlich klar, als das im Text passierte - man musste ein LLM ein paar Tage lang nutzen, um ein echtes Gefühl für die Qualität zu bekommen, selbst wenn es technisch gesehen auf Platz 1 war. Jetzt passiert es auch bei Bildern und Videos!