Toinen esimerkki LLM:ien jatkuvasta ongelmasta. Ne pärjäävät erittäin hyvin tavallisissa lääketieteellisissä kysymyksissä, mutta kun oikea vastaus korvataan "ei mikään yllä olevista", suorituskyky laskee. Uudemmilla malleilla on yleensä pienempi suorituskyvyn lasku.
15,32K