📢 Utgivelse av vår nyeste artikkel
Valgt ut til @AAAI '26-workshop.
Vi viser at LLM-ers evne til å forutsi virkelige spørsmål fra prediksjonsmarkeder (som polymarket) varierer betydelig mellom kategorier.
👉 Vår metode viser at selv om tillegg av nyheter hjelper, legger det også til visse feilmoduser som definisjonsdrift, nylig bias og rykteankering
📢 Utgivelse av vår nyeste artikkel
Valgt ut til @NeurIPSConf workshop om effektiv resonnement!
Vi viser at den optimale testtidsskaleringsmetoden er iterativ raffinering gjennom sekvensielle trinn.
👉 Metoden vår slår flertallsstemmer fra parallelle kjeder i 95 % av konfigurasjonene med nøyaktighetsgevinster på opptil 46,7 % ved matchet databehandling.