Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Chúa ơi… tài liệu này có thể là sự chuyển mình quan trọng nhất trong cách chúng ta sử dụng LLMs trong suốt năm nay.
"Mô hình nguyên nhân lớn từ các mô hình ngôn ngữ lớn."
Nó cho thấy bạn có thể phát triển các mô hình nguyên nhân đầy đủ trực tiếp từ một LLM, không phải là các xấp xỉ, không phải là cảm giác, mà là các đồ thị nguyên nhân thực sự, các phản thực, các can thiệp và các cấu trúc đã được kiểm tra ràng buộc.
Và cách họ làm điều đó thật điên rồ:
Thay vì đào tạo một mô hình nguyên nhân chuyên biệt, họ thẩm vấn LLM như một nhà khoa học:
→ trích xuất một đồ thị nguyên nhân ứng cử từ văn bản
→ yêu cầu mô hình kiểm tra các độc lập điều kiện
→ phát hiện mâu thuẫn
→ sửa đổi cấu trúc
→ kiểm tra các phản thực và dự đoán can thiệp
→ lặp lại cho đến khi mô hình nguyên nhân ổn định
Kết quả là một thứ mà chúng ta chưa bao giờ có trước đây:
một hệ thống nguyên nhân được xây dựng bên trong LLM sử dụng kiến thức thế giới tiềm ẩn của chính nó.
Trên các tiêu chuẩn tổng hợp, thế giới thực, các lĩnh vực lộn xộn, những LCM này vượt trội hơn các phương pháp phát hiện nguyên nhân cổ điển vì chúng rút ra từ kiến thức trước đó khổng lồ của LLM thay vì chỉ là các tương quan cục bộ.
Và lý luận phản thực?
Thật đáng kinh ngạc.
Mô hình có thể trả lời các câu hỏi "nếu thì" mà các thuật toán tiêu chuẩn hoàn toàn thất bại, chỉ đơn giản vì nó đã "biết" những điều về thế giới mà các thuật toán đó không thể suy luận từ dữ liệu một mình.
Tài liệu này gợi ý về một tương lai mà LLMs không chỉ là những cỗ máy mẫu.
Chúng trở thành các động cơ nguyên nhân, các hệ thống hình thành, kiểm tra và tinh chỉnh các giải thích cấu trúc về thực tại.
Nếu điều này mở rộng, mọi lĩnh vực dựa vào suy diễn nguyên nhân như kinh tế, y tế, chính sách, khoa học sắp được viết lại.
LLMs sẽ không chỉ cho bạn biết điều gì xảy ra.
Chúng sẽ cho bạn biết tại sao.

41
Bài báo của DeepMind này vừa âm thầm tiêu diệt lời nói dối an ủi nhất trong an toàn AI.
Ý tưởng rằng an toàn liên quan đến cách mà các mô hình hoạt động phần lớn thời gian nghe có vẻ hợp lý. Nó cũng sai ngay khi các hệ thống mở rộng. DeepMind chỉ ra lý do tại sao các giá trị trung bình không còn quan trọng khi triển khai đạt hàng triệu tương tác.
Bài báo định hình lại an toàn AGI như một vấn đề phân phối. Điều quan trọng không phải là hành vi điển hình. Mà là đuôi. Những thất bại hiếm hoi. Các trường hợp biên. Những sự kiện có xác suất thấp mà cảm giác như có thể bỏ qua trong các bài kiểm tra nhưng trở nên không thể tránh khỏi trong thế giới thực.
Các tiêu chuẩn, nhóm phản biện, và các buổi trình diễn đều lấy mẫu từ giữa. Triển khai lấy mẫu mọi thứ. Người dùng kỳ lạ, động lực kỳ quặc, vòng phản hồi thù địch, môi trường mà không ai lên kế hoạch. Khi mở rộng, những trường hợp đó không còn hiếm. Chúng là điều chắc chắn.
Đây là cái nhìn không thoải mái: tiến bộ có thể làm cho các hệ thống trông an toàn hơn trong khi âm thầm làm cho chúng nguy hiểm hơn. Nếu khả năng phát triển nhanh hơn kiểm soát đuôi, các thất bại có thể nhìn thấy giảm xuống trong khi rủi ro thảm khốc tích lũy ngoài màn hình.
Hai mô hình có thể trông giống hệt nhau về mặt trung bình nhưng vẫn khác nhau một cách hoang dã trong hành vi tồi tệ nhất. Các đánh giá hiện tại không thể thấy khoảng cách đó. Các khung quản trị giả định rằng họ có thể.
Bạn không thể chứng nhận an toàn với các bài kiểm tra hữu hạn khi rủi ro sống trong sự thay đổi phân phối. Bạn không bao giờ đang kiểm tra hệ thống mà bạn thực sự triển khai. Bạn đang lấy mẫu một tương lai mà bạn không kiểm soát.
Đó là câu chuyện thực sự.
An toàn AGI không phải là một thuộc tính của mô hình. Nó là một vấn đề hệ thống. Bối cảnh triển khai, động lực, giám sát, và mức độ rủi ro đuôi mà xã hội chấp nhận đều quan trọng hơn những giá trị trung bình sạch sẽ.
Bài báo này không làm bạn yên tâm. Nó loại bỏ ảo tưởng.
Câu hỏi không phải là liệu mô hình thường hoạt động tốt.
Mà là điều gì xảy ra khi nó không — và tần suất mà điều đó được cho phép trước khi quy mô làm cho nó không thể chấp nhận được.
Bài báo:

39
Hàng đầu
Thứ hạng
Yêu thích

