A cosa serve la revisione tra pari? Immagina che #AI possa fornire un feedback tecnicamente corretto che sia lo stesso di quello del revisore medio, allora perché ci importa di cosa pensano questi particolari revisori riguardo a ciò che è importante ("gusto")?
Andrew Ng
Andrew Ng25 nov 2025
Rilasciamo un nuovo "Agente Revisore" per articoli di ricerca. Ho iniziato a codificare questo come progetto del fine settimana, e @jyx_su lo ha reso molto migliore. Sono stato ispirato da uno studente che ha avuto un articolo rifiutato 6 volte in 3 anni. Il loro ciclo di feedback -- aspettare ~6 mesi per ricevere un feedback ogni volta -- era dolorosamente lento. Volevamo vedere se un flusso di lavoro agentico può aiutare i ricercatori a iterare più velocemente. Quando abbiamo addestrato il sistema sulle recensioni di ICLR 2025 e misurato la correlazione di Spearman (più alta è meglio) sul set di test: - Correlazione tra due revisori umani: 0.41 - Correlazione tra AI e un revisore umano: 0.42 Questo suggerisce che la revisione agentica si sta avvicinando a prestazioni a livello umano. L'agente fonda il suo feedback cercando su arXiv, quindi funziona meglio in campi come l'AI dove la ricerca è pubblicata liberamente. È uno strumento sperimentale, ma spero che ti aiuti con la tua ricerca. Dai un'occhiata qui:
Affronto spesso questo problema come revisore: penso che #AI fornisca commenti tecnici abbastanza accurati. Quindi, affinché il mio lavoro di revisione abbia un vero significato, devo credere che la mia opinione personale e il mio punto di vista siano importanti. Ma le opinioni/gusti dei revisori dovrebbero contare?
1,93K