Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Bài báo mới này thật điên rồ!
Nó gợi ý rằng các tác nhân dựa trên LLM hoạt động theo các quy luật vật lý vĩ mô, tương tự như cách mà các hạt hành xử trong các hệ thống nhiệt động lực học.
Và có vẻ như đây là một phát hiện áp dụng cho tất cả các mô hình.
Các tác nhân LLM hoạt động rất tốt trên nhiều lĩnh vực khác nhau, nhưng chúng ta không có lý thuyết giải thích tại sao.
Hành vi của những hệ thống này thường được coi là sản phẩm trực tiếp của kỹ thuật nội bộ phức tạp: mẫu nhắc, mô-đun bộ nhớ và gọi công cụ tinh vi. Động lực học vẫn là một hộp đen.
Nghiên cứu mới này gợi ý rằng các tác nhân điều khiển bởi LLM thể hiện sự cân bằng chi tiết, một thuộc tính cơ bản của các hệ thống cân bằng trong vật lý.
Điều này có nghĩa là gì?
Nó gợi ý rằng các LLM không chỉ học các tập quy tắc và chiến lược; chúng có thể đang học một hàm tiềm năng cơ bản mà đánh giá các trạng thái một cách toàn cầu, nắm bắt điều gì đó như "cách xa mà LLM nhận thức một trạng thái so với mục tiêu." Điều này cho phép hội tụ có định hướng mà không bị mắc kẹt trong các chu kỳ lặp lại.
Các nhà nghiên cứu đã nhúng các LLM vào trong các khung tác nhân và đo lường xác suất chuyển tiếp giữa các trạng thái. Sử dụng nguyên lý hành động tối thiểu từ vật lý, họ đã ước lượng hàm tiềm năng điều khiển những chuyển tiếp này.
Kết quả trên GPT-5 Nano, Claude-4 và Gemini-2.5-flash: các chuyển tiếp trạng thái chủ yếu thỏa mãn điều kiện cân bằng chi tiết. Điều này cho thấy rằng động lực học sinh ra của chúng thể hiện các đặc điểm tương tự như các hệ thống cân bằng.
Trong một nhiệm vụ phù hợp biểu tượng với 50,228 chuyển tiếp trạng thái qua 7,484 trạng thái khác nhau, 69.56% các chuyển tiếp có xác suất cao di chuyển về phía tiềm năng thấp hơn. Hàm tiềm năng đã nắm bắt các đặc điểm cấp độ biểu thức như độ phức tạp và tính hợp lệ cú pháp mà không cần thông tin cấp độ chuỗi.
Các mô hình khác nhau cho thấy các hành vi khác nhau trên phổ khám phá-khai thác. Claude-4 và Gemini-2.5-flash hội tụ nhanh chóng đến một vài trạng thái. GPT-5 Nano khám phá rộng rãi, tạo ra 645 đầu ra hợp lệ khác nhau trong 20,000 thế hệ.
Đây có thể là phát hiện đầu tiên về một quy luật vật lý vĩ mô trong động lực học sinh ra của LLM mà không phụ thuộc vào các chi tiết mô hình cụ thể. Nó gợi ý rằng chúng ta có thể nghiên cứu các tác nhân AI như các hệ thống vật lý với các thuộc tính có thể đo lường và dự đoán được thay vì chỉ là các sản phẩm kỹ thuật.
Bài báo:
Học cách xây dựng các tác nhân AI hiệu quả trong học viện của chúng tôi:

Hàng đầu
Thứ hạng
Yêu thích
