Hari ini kami merilis model Schematron: 3B dan 8B yang mengekstrak JSON yang diketik dari HTML dengan akurasi tingkat perbatasan. Kami membangun Schematron untuk menjadi pekerja keras utama untuk ekstraksi data: – 50-100x lebih murah dari GPT-5 – ~10x latensi lebih rendah – Kedua model mengungguli Gemini 2.5 Flash pada ekstraksi terstruktur Schematron membuat data web terstruktur skala internet dapat diakses oleh pengembang, peneliti, dan agen. Tersedia sekarang melalui API nirserver kami dan di HuggingFace. Baca detail dan tolok ukur pelatihan di blog 👇 kami