Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

Mistral AI 最近发布了其最新版本的文档识别技术 ——Mistral OCR3，标志着文档处理领域的重大进步。该技术在处理各类文档时展现了卓越的准确性和高效性，特别是在表格、扫描文档、复杂表格以及手写识别方面，相较于其前一版本 Mistral OCR2，整体表现提升了74%。

Mistral OCR3的设计宗旨在于从多种类型的文档中提取文本和嵌入式图像，以实现极高的准确度和出色的性能。它不仅支持 Markdown 输出，还能够基于 HTML 重构表格，帮助下游系统更好地理解文档的内容和结构。与市面上许多同类产品相比，Mistral OCR3体积小巧且价格合理，每1000页的处理费用仅为2美元，通过批量 API 更能享受50% 的折扣，最终价格低至每1000页仅1美元。

为了确保产品的准确性，Mistral OCR3引入了更具挑战性的内部基准，专注于真实业务场景中的表现。与前几代 OCR 模型相比，该技术在处理手写识别、表单、扫描及复杂文档等方面进行了显著升级，适应了多种文档类型的需求。

Mistral OCR3特别适合高容量企业级流程以及交互式文档工作流程。开发者可以通过该技术将文本和图像提取为 Markdown 格式，自动解析发票、合规表格等各类文档，并实现手写或历史文件的数字化处理。目前，早期客户已经在发票处理、公司档案数字化以及技术报告文本提取等方面取得了积极成果。

IDC 的研究总监蒂姆・劳指出，OCR 技术是实现生成式人工智能和智能体人工智能的重要基础。能够高效提取高保真度文本和嵌入式图像的组织，将有机会释放数据价值，从而在竞争中获得优势。

划重点:
📄 Mistral OCR3的整体准确性比前一版本提升74%，尤其在复杂文档处理方面表现卓越。
💰 该技术价格合理，每1000页处理费用仅为2美元，通过批量 API 可降至1美元。
🖥️ Mistral OCR3适用于多种业务场景，包括发票处理、文档解析及历史文件数字化。

混元重建后首发并开源 Hy3 preview：主打全面实用性，Agent能力大幅提升

腾讯混元于4月23日发布并开源Hy3preview语言模型，这是一个融合快慢思考的混合专家模型，总参数295B，激活参数21B，支持256K上下文。作为重建后训练的首个模型，它在复杂推理、指令遵循、上下文学习、代码和智能体等能力上显著提升，是混元迄今最智能的模型。2026年2月，腾讯混元重建了预训练和强化学习基础设施，注重模型实用性。

马斯克被 “造谣” 加入拼好饭网友惊呼 AI 时代真相不再

近日，网络接连出现伪造信息：先是小米汽车“官宣”苹果CEO库克出任CEO的假图引发热议并登上热搜，小米高管紧急辟谣；随后又传出全球首富马斯克加入“拼多多”的虚假消息。这些谣言因制作逼真误导网友，相关方已提醒公众勿信谣传谣。

Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

相关推荐

混元重建后首发并开源 Hy3 preview：主打全面实用性，Agent能力大幅提升

腾讯推出最新开源语言模型 Hy3 Preview，引领智能时代新潮流

马斯克被 “造谣” 加入拼好饭网友惊呼 AI 时代真相不再

微软正式重塑 Edge 浏览器界面，呈现统一的 AI 风格

字节跳动推出全新3D 生成模型 Seed3D2.0，技术跃升至 SOTA 水平

Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

相关推荐

混元重建后首发并开源 Hy3 preview：主打全面实用性，Agent能力大幅提升

腾讯推出最新开源语言模型 Hy3 Preview，引领智能时代新潮流

​马斯克被 “造谣” 加入拼好饭 网友惊呼 AI 时代真相不再

​微软正式重塑 Edge 浏览器界面，呈现统一的 AI 风格

字节跳动推出全新3D 生成模型 Seed3D2.0，技术跃升至 SOTA 水平

马斯克被 “造谣” 加入拼好饭网友惊呼 AI 时代真相不再

微软正式重塑 Edge 浏览器界面，呈现统一的 AI 风格