super cool zu sehen, wie das zusammenkommt, unglaubliche Arbeit geleitet von @brendanh0gan, alles in allem ein unglaublich detailliertes Rezept dafür, was nötig ist, um ein Spezialmodell für OOD-Aufgaben zu erstellen, bei denen Grenzmodelle wirklich Schwierigkeiten haben. Paper/Gewichte/Daten/Code in brendans Thread :)
Brendan Hogan
Brendan Hogan13. Aug., 22:42
Wir stellen qqWen vor: unser vollständiges Open-Source-Projekt (Code+Gewichte+Daten+detaillierter technischer Bericht) für die Full-Stack-Feinabstimmung (Pretrain+SFT+RL) einer Reihe von Modellen (1.5b, 3b, 7b, 14b & 32b) für eine Nischen-Finanzprogrammiersprache namens Q Alle Details unten!
18,34K