Selen lar deg komme mye lenger bare ved å yolo, men ytelsen kan forbedres dramatisk med litt profilering. Hva bruker opp konteksten. Hva tar opp plassen, se på sporene. Hva som tynger seg i minnet. Hva er det som fucker opp og kaster feil? Hva tar altfor lang tid (300 ganger for lenge) fordi det lastes inn i FP32 i stedet for FP16 og byttes ut i systemminnet
Hva er modellens tilbøyeligheter? Hva kan du bygge i miljøet for å forbedre kapasiteten basert på disse tilbøyelighetene. Hvordan kan du forbedre langsiktig sammenheng og hukommelse
31