Sangat keren untuk melihat ini bersatu, pekerjaan luar biasa yang dipelopori oleh @brendanh0gan, secara keseluruhan resep yang sangat rinci tentang apa yang diperlukan untuk membuat model spesialis untuk tugas OOD di mana model perbatasan benar-benar kesulitan kertas/bobot/data/kode di benang Brendan :)
Brendan Hogan
Brendan Hogan13 Agu, 22.42
memperkenalkan qqWen: proyek sumber terbuka kami (kode + bobot + data + laporan teknis terperinci) untuk penyempurnaan tumpukan penuh (pretrain + SFT + RL) serangkaian model (1.5b, 3b, 7b, 14b & 32b) untuk bahasa pemrograman keuangan khusus yang disebut Q Semua detail di bawah ini!
18,25K