当前位置: 首页> 腾云科技> 正文

开源OCR工具olmOCR:高效实现 PDF 转文本,支持表格与手写识别

olmOCR是一款开源的光学字符识别工具,专注于将PDF及其他文档高效转换为可编辑文本。它不仅支持普通文本提取,还能处理表格、数学公式和手写内容,极大地方便了用户的文档处理需求。该工具经过大量文献训练,具备高准确率,减少错误生成。

开源OCR工具olmOCR.png

亮点提要:

开源工具olmOCR可高效将PDF和其他文档转换为文本,支持多种格式。

该工具经过学术和技术文献的训练,具有高准确性和减少错误的优势。

用户可在线体验或在自己的GPU上部署以获得更快的处理速度。

详情入口:

https://github.com/allenai/olmocr