Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tôi bắt đầu thấy các mô hình của Anthropic như là các mô hình "lý luận nhẹ", trong khi các mô hình của OpenAI là các mô hình "lý luận sâu".
Với chỉ "Lý luận nhẹ", Sonnet 4.5 xuất sắc trong việc sử dụng ngữ cảnh hiệu quả để xác định thông tin.
Các cuộc gọi công cụ Codex thì cồng kềnh, và chúng được xen kẽ với các token lý luận để kiểm tra giả thuyết. Nó cần ngữ cảnh để hiểu rõ hơn về vấn đề.
Khoảng cách giữa GPT-5 và Sonnet 4.5 trở nên rõ ràng khi bạn có một cửa sổ ngữ cảnh "nóng", nơi không cần thêm cuộc gọi công cụ nào.
GPT-5 có thể suy nghĩ trong nhiều phút để tìm ra một giải pháp chi tiết hoàn chỉnh, trong khi Sonnet 4.5 hài lòng với vài giây cho một giải pháp có thể sử dụng.
Lý luận sâu chỉ hoạt động với ngữ cảnh đủ, nhưng cho phép mô hình thực sự đánh giá các vấn đề một cách toàn diện đến mức nó có vẻ gần như siêu nhân.
Ngược lại, lý luận nhẹ gần gũi hơn với bề mặt, nhưng phục vụ như một không gian thở cho các mô hình để thu thập suy nghĩ của chúng. Nó theo nhiều cách mà con người hơn.
Anthropic đang dẫn đầu rõ rệt trong lý luận nhẹ. Gpt-5 với suy nghĩ tối thiểu kém thông minh hơn 4o trong nhiều bài kiểm tra.
Tôi mong đợi Google sẽ chiến đấu trên cả hai mặt trận, với flash 3 về lý luận nhẹ, và pro / ultra 3 về lý luận sâu.
Hàng đầu
Thứ hạng
Yêu thích