Sự chuyển mình từ "các tác nhân không gần như có thể hoạt động" đến "được rồi, các tác nhân hẹp cho nghiên cứu và lập trình hoạt động khá tốt" đến (rất gần đây) "các tác nhân đa năng thực sự hữu ích cho một loạt các nhiệm vụ" đã diễn ra nhanh chóng (chưa đầy một năm) đến mức hầu hết mọi người đã bỏ lỡ.
Tất nhiên, các đại lý vẫn gặp nhiều vấn đề, nhưng về việc sử dụng công cụ, số lượng bước làm việc và giảm tỷ lệ lỗi, đây là một bước nhảy vọt lớn so với o1-preview cách đây một năm. Ngay cả Nghiên cứu Sâu và các đại lý lập trình khác dường như là những khả năng mà chúng ta không thể ngờ tới cách đây một năm.
160,38K