Một startup 6 người với 500.000 đô la vừa vượt qua Microsoft! MLE-Bench của OpenAI là một tiêu chuẩn kiểm tra các tác nhân trong các nhiệm vụ kỹ thuật Machine Learning. NEO @withneo, tác nhân MLE tự động đầu tiên, đã đạt 34,2% so với 22,4% của Microsoft trên tiêu chuẩn này. Điều này thật lớn!
3,67K