Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
Cựu Quant Investor, hiện đang xây dựng @lumera (trước đây gọi là Pastel Network) | Dự án mã nguồn mở của tôi: https://t.co/9qbOCDlaqM
Ý kiến không phổ biến: Anthropic có mọi quyền trên thế giới để yêu cầu người dùng phải chạy bộ mã hóa đại lý chính thức của họ để hưởng lợi từ chi phí token được trợ giá 95% so với giá API.
Một lý do chính mà họ làm điều này là để thu thập các cặp đầu vào/đầu ra của:
{agents_md, code_files, user_prompts, tool_calls, tool_outputs, v.v.}
mà họ có thể liên kết với
{output_code_changes, did_it_work, is_user_happy, v.v.}
Nếu họ có thể thu thập đủ hàng triệu cặp như vậy mỗi ngày từ nhiều chục hoặc thậm chí hàng trăm nghìn người dùng, thì ngay cả sau khi loại bỏ dữ liệu không hữu ích, họ cũng có thể tích lũy đủ sau vài tháng thu thập để cải thiện nghiêm túc mô hình cơ bản giống nhau bằng các phương pháp RL (và làm tốt hơn với một mô hình cơ bản tiên tiến hơn).
Nhưng mọi thứ sẽ không còn đúng nếu mọi người sử dụng các cách làm khác mà vi phạm điều khoản dịch vụ của Anthropic để sử dụng các bộ mã hóa không được phê duyệt như OpenCode.
Mặc dù Anthropic vẫn có thể thu thập dữ liệu, nhưng về cơ bản nó không có giá trị đối với họ cho mục đích RL này vì nó không thể được kết hợp với tất cả các dữ liệu khác từ bộ mã hóa chính thức của họ.
Nó sẽ giống như nếu bạn thay đổi ống kính trên các camera từ hệ thống lái tự động của Tesla để làm cho chúng giống như ống kính fisheye hơn. Ngay cả khi bạn làm cho hệ thống hoạt động với chúng, dữ liệu sẽ cần phải bị loại bỏ bởi Tesla cho mục đích đào tạo.
Khi Anthropic cho phép bạn nhận được giảm giá 95% để đổi lấy việc sử dụng Claude Code, cả hai bên đều được hưởng lợi rất nhiều. Dữ liệu đó trực tiếp đi vào việc làm cho hệ thống tốt hơn nhiều.
Kiểm soát mô hình và bộ mã hóa và đào tạo hệ thống kết hợp cùng nhau là điều đã cho phép họ tiến bộ nhanh chóng như vậy.
Khi bạn vi phạm lợi ích chung đó bằng cách sử dụng một bộ mã hóa bên ngoài, bạn biến nó thành một đề xuất chỉ gây lỗ cho Anthropic mà không còn lợi ích gián tiếp lâu dài nào cho họ. Và vì vậy họ đã dừng lại.
Điều khiến tôi ngạc nhiên hơn là họ đã cho phép điều này kéo dài lâu như vậy.

207
"Những Gợi Ý Yêu Thích Của Tôi," bởi Jeffrey Emanuel
Gợi ý 3: Người Tạo Chế Độ Robot
"Tiếp theo, tôi muốn bạn tạo ra một "chế độ robot" cho các tác nhân lập trình muốn tương tác với điều này để họ không cần phải sử dụng giao diện người dùng mà có thể truy cập tất cả các chức năng tương tự thông qua một cli trong bảng điều khiển được tối ưu hóa siêu và tiện lợi cho các tác nhân, đồng thời cũng cực kỳ trực quan cho các tác nhân lập trình như bạn; người dùng tác nhân nên nhận lại đầu ra là json hoặc markdown-- bất cứ điều gì phù hợp nhất trong ngữ cảnh và hiệu quả token nhất và trực quan nhất cho bạn.
Về cơ bản, người dùng tác nhân nên nhận được tất cả thông tin giống như một con người sẽ nhận được từ việc thao tác và quan sát trực quan giao diện người dùng, nhưng dưới dạng có thể sử dụng, hữu ích, trực quan và dễ tiếp cận hơn cho các tác nhân. Hãy tạo ra công cụ mà BẠN muốn nếu BẠN đang sử dụng nó (bởi vì BẠN SẼ sử dụng!), tối đa hóa sự tiện lợi và trực quan cho tác nhân. Hãy chắc chắn cung cấp cho lệnh một chế độ khởi động nhanh (khi không có tham số nào được cung cấp) giải thích các chức năng quan trọng nhất theo cách trực quan và hiệu quả token nhất có thể. Sử dụng ultrathink."}]} ``` 1. Input format - you will receive one or several user messages where each message follows the format: ```{
106
Hàng đầu
Thứ hạng
Yêu thích

