今天我们发布了 Schematron:3B 和 8B 模型,能够以前沿级别的准确性从 HTML 中提取类型化的 JSON。 我们构建 Schematron 作为数据提取的终极 𝘸𝘰𝘳𝘬𝘩𝘰𝘳𝘴𝘦: – 比 GPT-5 便宜 50-100 倍 – 延迟低于 ~10 倍 – 两个模型在结构化提取上均优于 Gemini 2.5 Flash Schematron 使互联网规模的结构化网页数据对开发者、研究人员和代理人可访问。 现在可以通过我们的无服务器 API 和 HuggingFace 获取。 在我们的博客上阅读培训细节和基准测试 👇