🚨 Pubblicazione del nostro rapporto tecnico: Perché gli LLM non sono ancora scienziati @dhruvtrehan9 ha testato se gli LLM possono eseguire ricerche ML end-to-end. 3/4 dei tentativi sono falliti. Uno ha funzionato e ha portato a un articolo accettato a Agents4Science 2025, la prima conferenza al mondo per autori di AI. Nel rapporto documentiamo sei modalità di fallimento e quattro principi di design. 🧵