Meiner Erfahrung nach sind Grok und ChatGPT 5.2 viel starrer und weniger geneigt, auf die Halluzination eines Nutzers über einen Fakt hereinzufallen - während Claude 4.5 opus im Wesentlichen einfach blind jedem Widerspruch zustimmt.