AI软件下载
有趣网站推荐及实用软件下载

PDF转md格式软件MinerU整合包下载,一键pdf批量转markdown免费工具

今天和大家分享一个PDF文件转Markdown格式软件MinerU,这个软件可以同时将一个pdf或是多个pdf文件批量转换成md格式和JSON格式文件,本软件为免费开源软件,原项目地址:https://github.com/opendatalab/MinerU,原应用是通过终端运行命令执行相应功能的,我做了个UI界面,如图所示:

PDF转md格式软件MinerU整合包下载,一键pdf批量转markdown免费工具

主要特点

  • 删除页眉、页脚、脚注和页码等元素,同时保持语义连续性
  • 从多列文档中以人类可读的顺序输出文本
  • 保留文档的原始结构,包括标题、段落和列表
  • 提取图像、图像说明、表格和表格说明
  • 自动识别文档中的公式并将其转换为 LaTeX
  • 自动识别文档中的表格并将其转换为 LaTeX
  • 自动检测并启用损坏 PDF 的 OCR
  • 支持 CPU 和 GPU 环境
  • 支持 Windows、Linux 和 Mac 平台(我打包版本只支持Windows)

软件操作也很简单,先选择PDF文件或是pdf所在文件夹,注意如果是选择文件夹的话路径末尾不能有”\”,再选择保存位置,处理方法默认auto,另外还有ocr和txt,如果正在处理包含大量公式的 PDF,强烈建议启用 OCR 功能。

如果有高配显卡的话,可以选择GPU模式速度更快,没有的话可以选择CPU模式,点击开始处理按钮,处理完成后在输出文件夹内就可以看到输出结果md和JSON格式文件

本整合包只支持Windows电脑版,不支持手机和mac,有需要的可以自己去测试。


2024-09-16更新

MinerU在9月12日发布了0.8.1版本,同时在14日发布了新的模型文件,所以我重新制作了最新版的一键启动整合包

新的整合包UI界面增加了表格操作的相关选项,如果你的PDF中有大量表格的话,可以通过开启表格识别功能增加导出效果

软件默认处理最大时间为400秒,也就是说如果超过400秒,你的转换任务还没有完成,那么软件可能会报错。所以请根据你的电脑配置合理安排每次识别PDF的数量


2024-11-24更新v0.10.0

我更新了最新0.10.0版本整合包,详情查看《最新版PDF转Markdown格式软件MinerU一键启动整合包v0.10.0下载

PDF格式转Markdown软件MinerU一键启动整合包下载

此内容仅限VIP查看,请先
可通过每日签到获得积分兑换VIP


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(5) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

免费在线HTML转markdown工具

经常看一些在线文档,想复制给AI参考的话不方便直接复制,转换成markdown再给AI阅读会更简单明了,也方便自己查阅,这里给大家推荐两个在线的免费HTML转markdown网站。 1、https://d1tools.com/tools/c...

LTX2.3+comfyui音频驱动视频生成工作流

这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...

windows电脑C盘垃圾查找清理软件

电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫