AI软件下载
有趣网站推荐及实用软件下载

PDF/图片转markdown软件MonkeyOCR整合包,文档图片解析工具下载

MonkeyOCR是上个月刚发布的一款文档解析工具,可以将PDF文档或图片识别转换为markdown格式文件。官方测试显示性能极佳。我基于当前最新版制作了免安装一键启动整合包,支持批量操作,并降低了显卡要求。

MonkeyOCR官方介绍

MonkeyOCR 采用结构-识别-关系 (SRR) 三重范式,简化了模块化方法的多工具流程,同时避免了使用大型多模式模型进行全页文档处理的低效率。

  1. 与基于流水线的方法MinerU相比,我们的方法在九种类型的中英文文档上平均提高了5.1%,其中公式提高了15.0%,表格提高了8.6%。
  2. 与端到端模型相比,我们的 3B 参数模型在英文文档上取得了最佳平均性能,优于 Gemini 2.5 Pro 和 Qwen2.5 VL-72B 等模型。
  3. 对于多页文档解析,我们的方法达到了每秒 0.84 页的处理速度,超过了 MinerU(0.65)和 Qwen2.5 VL-7B(0.12)。

MonkeyOCR整合包使用说明

将网盘内的软件压缩包下载到本地电脑上并解压。双击【启动软件.exe】

选择待处理文件,或是将文件或文件夹鼠标左键按住拖动到软件窗口内释放。

输入文件路径就处理文件,输入文件夹路径就处理文件夹内所有pdf文档

【组大小】按特定分组大小对输入路径(一个目录)中的图像进行分组解析

【nums】这是我自己添加的一个参数,因为原应用用起来有些问题,这个主要是增加对低端显卡的支持,如果显卡为20X6G等低端显卡,运行报错的话尝试设置为1.如果显卡为40X高端大显存显卡可尝试增大该值,会影响处理速度。如果软件没有报错的话建议保持默认即可。

【单任务】单任务识别,如识别文本、公式、表格,(仅输出 Markdown 格式)

【输出单页面】解析 PDF 并按页面拆分结果

默认只输入待处理文件和保存位置即可,没有必要的话其它设置可不用管。

软件支持批量操作,输入文件夹路径或是将文件夹拖入软件窗口即可。

视频教程及效果演示:https://nuowa.net/2048

注意事项

未测试最低配置要求,建议英伟达显卡显存不低于6G,如果报错:No enough gpu memory for runtime。则需要更多显存

软件只支持windows 10或11

软件运行路径中不要有非英文字符及空格,待处理文件同样注意

PDF转MD软件MonkeyOCR整合包下载链接

https://pan.quark.cn/s/e25dfa6e0f5a

MonkeyOCR本地电脑安装部署教程

https://nuowa.net/2047

领即梦AI免费积分,开启AI创作之旅:速领>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(2) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

免费在线视频去水印工具方法-诺瓦小站

免费在线视频去水印工具方法

本次分享一个免费的在线视频去水印工具–记灵 这个在线工具目前是完全免费的,上传mp4视频文件,然后鼠标框选去水印区域,然后点击处理等待处理完成就可以了,操作非常简单。 这个去水印工具是采用打码的方式覆盖原水印区域的,并不是AI智...

Unreal Engine 5恐怖游戏设计制作教程,从入门到精通从零开始完整项目开发详细讲解,中英文字幕-诺瓦小站

Unreal Engine 5恐怖游戏设计制作教程,从入门到精通从零开始完整项目开发详细讲解,中英文字幕

和大家分享一个以前收集的UE5虚幻引擎恐怖游戏开发教程,这是国外一个大神制作的视频教程,教程从零开始到制作出一款完整的游戏。内容讲解全面,如蓝图基础知识讲解、角色控制、高级交互系统、高级库存系统、物品检查、恐怖环境氛围设计、过场动画、AI系...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫