从“代理人根本无法工作”到“好吧,专用代理人在研究和编码方面表现得相当不错”,再到(最近)“通用代理实际上对一系列任务是有用的”,这一转变发生得非常迅速(不到一年),以至于大多数人都没有注意到。
当然,代理仍然面临许多问题,但在工具使用、工作步骤数量和错误率降低方面,与一年前的o1-preview相比,这是一个巨大的飞跃。 即使是深度研究和各种编码代理,似乎也是我们一年前无法预料的能力。
158.88K