🚨 发布我们的技术报告:为什么 LLM 还不是科学家 @dhruvtrehan9 测试了 LLM 是否能够进行端到端的机器学习研究。4 次尝试中有 3 次失败。一次成功了,并导致一篇论文被 2025 年的 Agents4Science 接受,这是全球首个 AI 作者会议。 在报告中,我们记录了六种失败模式和四个设计原则。🧵