Joku r/LocalLLaMA:ssa koulutti LLM:n alusta alkaen Lontoon teksteillä vuosina 1800–1875 Hauska artefakti > "puhelin" keksittiin vuonna 1876 > aineisto päättyy vuoteen 1875 > kun kysyt "puhelin" > malli kohtelee sitä kuin > jokin salainen diplomaattinen keino > tai salaperäinen laite Malli ja data > 1.2B-parametrit > ~90GB korpus > kirjoja, lehtiä, oikeudellisia asiakirjoja > uskonnollista kirjoittamista, lääketieteellisiä artikkeleita Tokenisaattori > mukautettu tokenisaattori > koulutettu samalla aineistolla Koulutus > ~182k harjoitusvaihetta > koulutettu vuokratulla H100 SXM:llä