热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Aidan McLaughlin
个性招聘@openai
我*真的*很喜欢这个版本的gpt5聊天,认为它是休闲对话的最先进技术。
它仍然比4o少很多谄媚,但它是_友好的_,以一种gpt5聊天有时没有的方式无条件地支持我。

OpenAI15 小时前
我们正在根据反馈使GPT-5变得更加温暖和友好,因为之前的反馈认为它显得过于正式。变化是微妙的,但ChatGPT现在应该感觉更易接近。
你会注意到一些小而真诚的细节,比如“好问题”或“很好的开始”,而不是恭维。内部测试显示,与之前的GPT-5个性相比,谄媚的程度没有上升。
变化可能需要最多一天的时间才能推出,更多更新即将到来。
51.51K
Aidan McLaughlin 已转发
在通过Cursor和网页应用中的GPT-5 Pro模型进行几天的密集使用后,我坚持我所说的一切,认为它是一个更聪明的模型,在编码方面比Opus 4.1更优秀。
我仍然喜欢Opus,并且在许多方面发现Claude Code的使用体验更好,但如果你试图做一些真正困难的事情,需要真正聪明的第一性原理思维和计算机科学能力,GPT-5是一个更高的水平。
但我怀疑这只有在推理努力模式设置为至少中等时才会显现出来,并且在高努力设置下真正表现出来。
一个好的例子是准备两份长而复杂的法律文件的“红线”文档。不是同一文档的不同版本,而是来自共享通用模板的两份不同文档。
这是一个非常非常难以做好工作的难题,需要许多聪明的技巧和启发式方法来提供体面的性能和输出质量(我在这里谈论的是使用传统编程技术,而不是使用LLM进行这种比较)。
与Opus 4.1相比,使用Cursor代理的GPT-5可以更快地提出更多、更好、更聪明(但务实)的想法,并且能够正确实施这些想法,而不需要太多的指导。
不过,这取决于你正在做的工作。例如,我仍然认为我更喜欢Opus的NextJS前端代码。
但你绝对应该在自己的实际问题上进行检查,而不是相信那些说模型糟糕并且证明我们已经碰壁的许多人。
要么他们在没有思考的情况下使用糟糕的免费版本,要么他们根本不知道如何有效地提示,或者他们让自己对OpenAI和Altman的感情影响了他们的看法。
36.17K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可