Ogni compito di dimostrazione LLM è al massimo due: 1) Un compito per il quale qualcuno sarebbe disposto a pagare 2) Un compito che distingue i LLM all'avanguardia dalla generazione precedente 3) Qualcosa che leggeresti volentieri in un tweet
Buoni benchmark fanno 1+2. Il mio cavallo di battaglia è 2+3.
54