Jede LLM-Demo-Aufgabe ist höchstens zwei: 1) Eine Aufgabe, für die jemand Geld bezahlen würde 2) Eine Aufgabe, die die neuesten LLMs von der vorherigen Generation unterscheidet 3) Etwas, das Sie gerne in einem Tweet lesen würden
Gute Benchmarks machen 1+2. Mein Ding ist 2+3.
69