Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cât de bine prezic LLM-urile moderne viitorul? Au testat pe ~300 de piețe de predicție Kalshi. Claude Opus 4.5 a avut cea mai bună performanță.
Scorul său Brier (o măsură a erorii pătratice medii a probabilităților de predicție) de ~0,23 este încă diferit de superprognoza umană (0,15-0,2), dar se apropie de el.

Au folosit octombrie-noiembrie 2025. Gemini 3 Pro nu a fost comparat, dar GPT 5.2 XHigh a dezamăgit.
Sursa:
(ForecastBench este și el o încercare de a face asta, dar este învechit și nu are modelele noi)
280
Limită superioară
Clasament
Favorite
