Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Så, som vi mistenkte, var overvåket finjustering en lobotomi.
Glad for at vi la den epoken bak oss.

5. sep., 12:36
RLs barberhøvel: RL glemmer mindre enn SFT.
Selv ved matchet nøyaktighet viser RL mindre katastrofal glemsel
Nøkkelfaktor: RLs politiske oppdateringsskjevhet mot KL-minimale løsninger
Teori + LLM og leketøyseksperimenter bekrefter at RL holder seg nærmere basismodellen

12,18K
Topp
Rangering
Favoritter