właściwie to dość sprytny i oparty na dużych danych benchmark halucynacji, który ~odpowiada mojej intuicji na temat względnych możliwości