一個擁有50萬美元的6人初創公司剛剛超越了微軟! OpenAI的MLE-Bench是一個測試代理在機器學習工程任務上表現的基準。 NEO @withneo,首個自主MLE代理,在基準測試中得分34.2%,而微軟僅為22.4%。 這太重要了!
2.5K