Elke LLM-demo-taak is maximaal twee: 1) Een taak waarvoor iemand geld zou betalen 2) Een taak die de grens-LMM's onderscheidt van de vorige generatie 3) Iets dat je graag in een tweet zou lezen
Goede benchmarks doen 1+2. Mijn trucje is 2+3.
71