Твердження про те, що GPT-5 бреше набагато менше, ніж o3, насправді не так вже й багато, враховуючи, яким абсолютним патологічно брехливим виродком є o3! Навіть скорочення на 80% все одно призведе до кількох брехень на день при інтенсивному використанні.
Нагадування:
Jeffrey Emanuel
Jeffrey Emanuel25 квіт. 2025 р.
Examples of o3 lying through its teeth in a really concerning way. It’s constantly making absolutely outrageous claims about how much faster the code is after its revisions (it doesn’t even know if it will *run*), whether it’s functioning properly, that it tested things, etc.
200