Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Podařilo se nám reprodukovat silná zjištění článku HRM o ARC-AGI-1.
Dále jsme provedli řadu ablačních experimentů, abychom se dostali k jádru toho, co je za tím.
Klíčová zjištění:
1. Samotná architektura modelu HRM (středobod článku) není důležitým faktorem.
2. Vnější smyčka zdokonalování (v článku sotva zmíněná) je hlavním hnacím motorem výkonu.
3. Učení s přenosem mezi úkoly není příliš užitečné. Důležité je školení o úkolech, na kterých budete testovat.
4. Můžete použít mnohem méně rozšíření dat, zejména v době odvozování.
Zjištění 2 a 3 znamená, že tento přístup je případem *nulového předtréninkového testovacího tréninku*, podobného nedávno publikovanému článku "ARC-AGI bez předtréninku" od Liao et al.
241,69K
Top
Hodnocení
Oblíbené