Decir que GPT-5 miente mucho menos que o3 no significa realmente mucho dado lo patológicamente mentiroso que es o3. Incluso una reducción del 80% aún resultaría en múltiples mentiras por día bajo un uso intensivo.
Recordatorio:
Jeffrey Emanuel
Jeffrey Emanuel25 abr 2025
Examples of o3 lying through its teeth in a really concerning way. It’s constantly making absolutely outrageous claims about how much faster the code is after its revisions (it doesn’t even know if it will *run*), whether it’s functioning properly, that it tested things, etc.
203