Hôm nay chúng tôi phát hành Schematron: các mô hình 3B và 8B có khả năng trích xuất JSON kiểu từ HTML với độ chính xác ở mức tiên tiến. Chúng tôi xây dựng Schematron để trở thành 𝘸𝘰𝘳𝘬𝘩𝘰𝘳𝘴𝘦 tối ưu cho việc trích xuất dữ liệu: – Rẻ hơn 50-100 lần so với GPT-5 – Độ trễ thấp hơn khoảng 10 lần – Cả hai mô hình đều vượt trội hơn Gemini 2.5 Flash trong việc trích xuất có cấu trúc Schematron giúp dữ liệu web có cấu trúc quy mô internet trở nên dễ tiếp cận cho các nhà phát triển, nhà nghiên cứu và đại lý. Có sẵn ngay bây giờ qua API không máy chủ của chúng tôi và trên HuggingFace. Đọc chi tiết đào tạo và các chỉ số trên blog của chúng tôi 👇