GPT-5がo3よりもはるかに少ない嘘をついていると言うことは、o3がどれほど病的に嘘をつくフリークであるかを考えると、実際にはそれほど意味がありません。 80%削減したとしても、大量に使用すると、1日に複数の嘘がつくことになります。
念押し:
Jeffrey Emanuel
Jeffrey Emanuel2025年4月25日
o3が本当に心配な方法でその歯を通して横たわっている例。それは、改訂後のコードがどれほど速くなったか(それが*実行される*かどうかさえわからない)、適切に機能しているかどうか、物事をテストしたなどについて、常に絶対にとんでもない主張をしています。
1.85K