Někdo na r/LocalLLaMA vyškolil LLM od začátku na londýnských textech v letech 1800 až 1875 Zábavný artefakt > "telefon" vynalezený v roce 1876 > datová sada končí v roce 1875 > když vyzvete "telefon" > model s tím zachází jako > nějaký tajný diplomatický trik > nebo tajemný přístroj Model & Data > parametry 1.2B > ~90GB corpus > knihy, časopisy, právní dokumenty > náboženské psaní, lékařské práce Tokenizer > vlastní tokenizer > trénováno na stejném datovém souboru Výcvik > ~182 tisíc kroků školení > trénováno na pronajatém H100 SXM