Mistral AI 最近发布了其最新版本的文档识别技术 ——Mistral OCR3,标志着文档处理领域的重大进步。该技术在处理各类文档时展现了卓越的准确性和高效性,特别是在表格、扫描文档、复杂表格以及手写识别方面,相较于其前一版本 Mistral OCR2,整体表现提升了74%。

image.png

Mistral OCR3的设计宗旨在于从多种类型的文档中提取文本和嵌入式图像,以实现极高的准确度和出色的性能。它不仅支持 Markdown 输出,还能够基于 HTML 重构表格,帮助下游系统更好地理解文档的内容和结构。与市面上许多同类产品相比,Mistral OCR3体积小巧且价格合理,每1000页的处理费用仅为2美元,通过批量 API 更能享受50% 的折扣,最终价格低至每1000页仅1美元。

为了确保产品的准确性,Mistral OCR3引入了更具挑战性的内部基准,专注于真实业务场景中的表现。与前几代 OCR 模型相比,该技术在处理手写识别、表单、扫描及复杂文档等方面进行了显著升级,适应了多种文档类型的需求。

image.png

Mistral OCR3特别适合高容量企业级流程以及交互式文档工作流程。开发者可以通过该技术将文本和图像提取为 Markdown 格式,自动解析发票、合规表格等各类文档,并实现手写或历史文件的数字化处理。目前,早期客户已经在发票处理、公司档案数字化以及技术报告文本提取等方面取得了积极成果。

IDC 的研究总监蒂姆・劳指出,OCR 技术是实现生成式人工智能和智能体人工智能的重要基础。能够高效提取高保真度文本和嵌入式图像的组织,将有机会释放数据价值,从而在竞争中获得优势。

划重点:  

📄 Mistral OCR3的整体准确性比前一版本提升74%,尤其在复杂文档处理方面表现卓越。  

💰 该技术价格合理,每1000页处理费用仅为2美元,通过批量 API 可降至1美元。  

🖥️ Mistral OCR3适用于多种业务场景,包括发票处理、文档解析及历史文件数字化。