Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
De ce nu pre-antrenăm modele pentru sarcini agentice?
ei bine, băieții ăștia au făcut-o. și a funcționat.
au introdus o etapă intermediară după pre-antrenament și înainte de post-antrenament. au sintetizat datele de acțiune ale agenților și modelul lor AgentFounder-30B stabilește noi SOTA pe 10 benchmark-uri.
SFT are, de asemenea, pierderi semnificativ mai mici după această etapă de pre-antrenament continuu Agentic.
De ce funcționează asta?
Deoarece modelele fundamentale de uz general nu au de obicei o prejudecată inductivă agentică, punând Burdon pe post-antrenament.
Când introduceți raționamentul în mai mulți pași și utilizarea instrumentelor în etapa de pre-antrenament, ușurați calea pentru post-antrenament, mai ales atunci când o faceți cu un amestec de sarcini agentice cu orizont scurt și lung.
Deci, ce înseamnă asta dacă vă conduceți afacerea pe agenți sau îi construiți la orice scară?
Puteți sintetiza date la costuri reduse, puteți pre-antrena în continuare un model fundamental și apoi îl puteți antrena ulterior.

Limită superioară
Clasament
Favorite