Non ho scritto di Model Spec da un po', ma Dean mi ha fatto un riconoscimento per i miei scritti precedenti su di essi, quindi è tempo di dire definitivamente di nuovo che ogni laboratorio di frontiera dovrebbe avere un modello spec. Costruisce fiducia a lungo termine con utenti, sviluppatori e regolatori. Il modello spec stabilisce le intenzioni su come il modello dovrebbe comportarsi, indipendentemente dal fatto che riesca o meno a farlo. Ancora una volta, sono felice di discutere di questo con i laboratori come consulenza gratuita, poiché penso sia fantastico per il mondo. Sembra che in gran parte siano bloccati dalla politica -- sia interna, dove i team non riescono a concordare su cosa dovrebbe fare il modello -- sia esterna, dove i laboratori temono reazioni negative. Il comportamento di questi modelli è in realtà notevolmente guidabile (condividerò presto ulteriori ricerche a cui partecipo su questo!) e la mancanza di modelli spec è piuttosto terribile come standard della comunità. I link al pezzo di Dean e ai miei pezzi più vecchi sui modelli spec sono tutti qui sotto. Man mano che Olmo migliora, questo è stato nella mia lista per crearne uno e condividere il processo, le difficoltà nel seguirlo, e così via. Accolgo la pressione di dover consegnare questo per impostare un esempio migliore.
OpenAI merita un sacco di meriti per questo, complimenti ancora a @joannejang + @johnschulman2
7,03K