Сказать, что GPT-5 лжет гораздо реже, чем o3, на самом деле не имеет большого значения, учитывая, насколько o3 является абсолютным патологическим лжецом! Даже 80%-е сокращение все равно приведет к нескольким лжи в день при интенсивном использовании.
Напоминание:
Jeffrey Emanuel
Jeffrey Emanuel25 апр. 2025 г.
Examples of o3 lying through its teeth in a really concerning way. It’s constantly making absolutely outrageous claims about how much faster the code is after its revisions (it doesn’t even know if it will *run*), whether it’s functioning properly, that it tested things, etc.
288