ve skutečnosti docela chytrý a vysoce datový halucinační benchmark, který ~odpovídá mé intuici ohledně relativních schopností
OpenRouter
OpenRouter15. 8. 00:29
Po jednom týdnu se GPT-5 dostal na první místo v našich patentovaných modelových žebříčcích přesnosti🥇 volání nástrojů Na druhém místě je Claude 4.1 Opus s 99,5 % Podrobnosti 👇
22,67K