Hamul îți permite să mergi mult mai departe doar cu yoloing, dar performanța poate fi îmbunătățită dramatic cu puțină profilare. Ce consumă contextul. Ce ocupă spațiul, uită-te la urme. ce se adună în amintire. Ce greșește și aruncă greșeli. ce durează mult prea mult (300 de ori prea mult) (pentru că se încarcă în FP32 în loc de FP16 și se schimbă în memoria sistemului
Care sunt înclinațiile modelului? Ce poți construi în mediu pentru a îmbunătăți capacitatea în funcție de aceste înclinații? Cum poți îmbunătăți coerența pe termen lung, memoria
29