Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Bạn đang tham gia phỏng vấn Kỹ sư ML tại Stripe.
Người phỏng vấn hỏi:
"Mọi người thường tranh chấp các giao dịch mà họ thực sự đã thực hiện.
Bạn sẽ xây dựng một mô hình dự đoán những tranh chấp giả này mà không có dữ liệu được gán nhãn như thế nào?"
Bạn: "Tôi sẽ đánh dấu các thẻ có tỷ lệ tranh chấp cao."
Phỏng vấn kết thúc.
Đây là những gì bạn đã bỏ lỡ:
Có một kỹ thuật gọi là Học chủ động cho phép bạn xây dựng các mô hình có giám sát mà không cần dữ liệu được gán nhãn. Nó rẻ hơn và nhanh hơn so với việc chú thích thủ công.
Ý tưởng rất đơn giản: nhận phản hồi từ con người về những ví dụ mà mô hình gặp khó khăn nhất.
Đây là cách nó hoạt động:
↳ Bắt đầu nhỏ: Gán nhãn thủ công 1-2% dữ liệu của bạn. Xây dựng mô hình đầu tiên của bạn trên tập dữ liệu nhỏ này. Nó sẽ không tốt, nhưng đó là mục đích.
↳ Tạo dự đoán: Chạy mô hình trên dữ liệu chưa được gán nhãn và ghi lại điểm số độ tin cậy. Các mô hình xác suất hoạt động tốt ở đây—nhìn vào khoảng cách giữa hai lớp dự đoán hàng đầu.
↳ Gán nhãn một cách chiến lược: Xếp hạng các dự đoán theo độ tin cậy. Để con người chỉ gán nhãn những ví dụ có độ tin cậy thấp nhất. Không có lý do gì để gán nhãn những gì mà mô hình đã biết.
↳ Lặp lại và cải thiện: Cung cấp dữ liệu đã gán nhãn trở lại cho mô hình. Đào tạo lại. Mô hình trở nên thông minh hơn về những gì nó không biết.
Dừng lại khi hiệu suất đáp ứng yêu cầu của bạn.
...

Hàng đầu
Thứ hạng
Yêu thích

