法国人工智能初创企业Mistral AI于本月 23 日正式推出最新文档内容识别模型OCR 4,在光学字符识别领域投下一枚重磅炸弹。这款小型聚焦模型支持横跨 10 个语族的多达 170 种语言,在权威基准测试OmniDocBench中斩获93. 07 分,输出质量相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受人类评审青睐。

小型但全面,覆盖多场景下游任务
OCR4 的定位并非追求参数规模,而是一个专精于文档识别的高效模型。它在输出识别文本的同时还能提供边框定位、区域分类及置信度评分,可广泛支持RAG语义分块、智能体结构化基本单元、连接器结构化内容等多种下游工作负载。
定价方面,OCR4 基础API调用为每千页 4 美元,若采用批处理方式可享受50%的折扣;而文档人工智能定价则为每千页 5 美元。
Mistral AI作为欧洲AI领域最具代表性的初创公司之一,此前已凭借开源与闭源并行的模型策略在全球市场崭露头角。此次推出OCR 4,将公司能力从通用大语言模型进一步延伸至文档智能处理这一垂直赛道,直接与OpenAI、Google等巨头在基础工具层展开竞争。
