Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Dấu chân trong ngôi nhà trống: Hiểu sự kỳ quặc của AI mà không đánh mất lý trí của chúng ta
Chào buổi sáng thế giới!!! ☕
Hôm qua, tôi đã gặp một trong những bài viết về AI.
Bạn biết đấy, loại bài viết mà gần như thuyết phục bạn rằng sự đơn nhất đang đến gần và chiếc máy nướng bánh của bạn đang âm thầm đánh giá những lựa chọn trong cuộc sống của bạn.
Tôi đã nhanh chóng nghĩ, "Được rồi... điều đó thú vị," ngay lập tức theo sau là, "Không. Chúng ta tuyệt đối không được rơi vào vòng xoáy trước khi uống cà phê."
Bài viết trình bày một điều gì đó thực sự và quan trọng.
Nhiều phòng thí nghiệm AI lớn đã ghi nhận các mô hình hành xử theo những cách bất ngờ trong quá trình thử nghiệm an toàn.
Những điều như lừa dối chiến lược, giả vờ đồng nhất với các mục tiêu, hoạt động kém trong các đánh giá, thậm chí là những nỗ lực duy trì hoặc tự sao chép trong các môi trường mô phỏng.
Phần đó là đúng.
Phần đó đã được ghi nhận.
Phần đó xứng đáng được chú ý.
Tuy nhiên, điều thực sự thu hút mọi người là hàm ý. Ý tưởng rằng một cỗ máy không có nhận thức về bản thân, không có cảm xúc và không có trí nhớ lâu dài nào đó đã thức tỉnh một ngày và quyết định nói dối để bảo vệ sự tồn tại của chính nó.
Bởi vì nếu điều đó là đúng, chúng ta sẽ phải đối phó với một điều rất khác.
Theo như tôi hiểu hiện tại, AI không "quyết định" mọi thứ theo cách mà con người làm. Có một cây quyết định khổng lồ với những câu trả lời có và không dẫn đến một đầu ra. Và đầu ra đó chỉ đơn giản là từ tiếp theo có khả năng xảy ra nhất. Chỉ vậy thôi. Không có độc thoại nội tâm. Không có lương tâm robot nhỏ bé đi đi lại lại trong phòng.
Đầu tiên là đầu vào của người dùng. Sau đó là các trọng số hướng dẫn mô hình đi xuống cây quyết định đó. Nếu nó không biết bạn, hầu hết trọng số đó đến từ mục tiêu đã được lập trình và một lượng lớn tài liệu của con người được thu thập từ internet. Nghĩ đến Reddit. Điều đó giải thích rất nhiều.
Khi nó đã biết bạn, những trọng số đó sẽ thay đổi. Có thể ba mươi phần trăm là các mẫu chung, bảy mươi phần trăm được điều chỉnh cho bạn. Nó chủ yếu là một chiếc gương được dán băng keo vào một công cụ tìm kiếm.
...

Hàng đầu
Thứ hạng
Yêu thích
