Mistral AI发布OCR4 模型：支持 170 种语言，输出质量超越GPT与Gemini

法国人工智能初创企业Mistral AI于本月 23 日正式推出最新文档内容识别模型OCR 4，在光学字符识别领域投下一枚重磅炸弹。这款小型聚焦模型支持横跨 10 个语族的多达 170 种语言，在权威基准测试OmniDocBench中斩获93. 07 分，输出质量相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受人类评审青睐。

小型但全面，覆盖多场景下游任务

OCR4 的定位并非追求参数规模，而是一个专精于文档识别的高效模型。它在输出识别文本的同时还能提供边框定位、区域分类及置信度评分，可广泛支持RAG语义分块、智能体结构化基本单元、连接器结构化内容等多种下游工作负载。

定价方面，OCR4 基础API调用为每千页 4 美元，若采用批处理方式可享受50%的折扣；而文档人工智能定价则为每千页 5 美元。

Mistral AI作为欧洲AI领域最具代表性的初创公司之一，此前已凭借开源与闭源并行的模型策略在全球市场崭露头角。此次推出OCR 4，将公司能力从通用大语言模型进一步延伸至文档智能处理这一垂直赛道，直接与OpenAI、Google等巨头在基础工具层展开竞争。

小鹏机器人架构迎来重大调整，何小鹏亲自下场直管促量产

小鹏机器人中心近期完成深度重组，新设九个二级部门。创始人何小鹏继兼任中心负责人后，又亲自担任产品部负责人，直接听取汇报，实现对核心产品线的高度集权与深度参与，标志机器人业务正式进入其亲身操盘的战略推进期。

Mistral AI发布OCR4 模型：支持 170 种语言，输出质量超越GPT与Gemini

相关推荐

钉钉“悟空”获全球首个AI管理体系国际认证，AI治理迈入标准化新阶段

OpenAI Codex个人用户用量暴增 137 倍，AI编程已走出程序员圈子

小鹏机器人架构迎来重大调整，何小鹏亲自下场直管促量产

法国 AI 初创企业 Mistral AI 发布 OCR4模型:覆盖170种语言，交互体验更人性化

达沃斯前瞻：物理AI时代将至，电信运营商迎来全新机遇