Marker是一个非常热门的可以将PDF及其它文档文件转换成Markdown/JSON/Html的应用,处理速度快识别精度高,支持批量多PDF转换,是一个强大的PDF转MD工具。它昨天更新了最新版本v1.1.0,我制作了最新版的一键启动包并重新制作了UI界面。
2025-03-21 更新v1.6.1版本

Marker简介
Marker 可以快速准确地将 PDF, image, PPTX, DOCX, XLSX, HTML, EPUB转换为 markdown、JSON 和 HTML。
- 支持多种文档
- 支持所有语言
- 删除页眉/页脚/其他物品
- 格式化表格和代码块
- 提取并保存图像和 Markdown
- 将方程式转换为乳胶
- 可通过您自己的格式和逻辑轻松扩展
- 适用于 GPU、CPU 或 MPS
相对于我分享的上个整合包,应用已经更新了多个版本了,而且更新内容比较多,具体更新内容如下:
Marker历史版本更新内容
12月13日 v1.1.0
标记错误修复和“pdftext”改进
- 修复以正确chunk_convert.sh处理output_dir
- pdftext改进和其它错误修复
- 空白页和目录错误修复
- 修复 README.md 并更新示例
- 更新至最新的 pdftext 版本,结合启发式分割技术,以增强性能和准确性
- 更新surya和tabled依赖项,并修复各种错误。
12月4日 v1.0.2
错误修复 – Python 3.10 兼容性、引号、图像
- 修复 Python 3.10 的问题
- 修复引号字符的位置
- 将默认图像输出类型更改为 JPEG,以提高速度和减小文件大小,同时最大程度地降低质量损失
12月3日 v1.0.1
错误修正和解析改进
- 修复大量杂项错误,包括编码、空白页问题和图像渲染
- 通过连接和嵌套改进列表处理
- 添加引用
- 稍微提高性能
11月28日 v1.0.0
这是marker v1 的版本,从头开始完全重写。
- 采用新的布局模型,速度提高 2 倍
- 块和页面的一致内部架构
- 模块化架构,处理器和渲染器可轻松覆盖
- JSON 块和 markdown 输出
- 大量单元测试
- 更高的输出质量
v0.3.10
性能改进,API 服务器
- 提高性能 10-15%
- 为本地用例添加一个简单的 API 服务器
v0.3.9
拼合 PDF、修复页面分隔符、修复 torch/transformers 错误
- 修复 transformers 4.46 和 torch 2.5 的问题
- 改进页面分隔符 – 它们现在出现在页面的开始处,并显示页码
- 在提取 Markdown 之前将表单字段展平到 PDF 中
v0.3.8
修复表格错误
- 修复当设置了 start_page 并且文档中有表格时导致转换失败的错误
v0.3.6
加速、修复错误
- 修复一些极端情况下的 OCR 错误
- 通过改进布局和文本检测,端到端加速约 20%
v0.3.1
修正错误,提高输出质量
- 修复 torch 2.5 的 MPS 错误
- 修复零线块的标题错误
- 提高视觉框与文本框偏移时的输出质量
10-18 v0.3.0
更好的表格、改进的输出质量、标题级别
- 集成自定义表格模型以实现更好的表格渲染 – 这使用了最先进的开放表格模型
Markdown 输出
- 调整块检测以全局改善 markdown 输出
- 以更好的方式将布局标签分配给块 – 将提高整体质量
- Markdown 输出中更好的行距
- 将脚注推至页尾
标题级别
- 添加对标题级别的检测,例如#、## 等。
- 添加计算目录
错误修正/杂项
- 修复分页不起作用的错误
- 使用调试图像输出进行更好的调试
- Python 3.13 支持
Marker一键启动整合包软件使用说明:
待处理文件(夹):需要转换的文件或是所在的文件夹,用鼠标左键单击文件或是文件夹按住拖动到程序窗口里,文件或是文件夹路径会自动填充到文本输入框中
禁用图片提取:PDF中有图片的话默认会提取出来,可以开启这个选项禁止提取图片
输出文件分页:是否对输出文件进行分页处理
禁用多进程:是否禁用多进程处理
OCR语言:如果进行OCR识别可指定语言,中文为zh,英语eng,法语fra,德语deu,其它语言代码可以查看我另一篇文章《语言名称及简写代码两字母三字母代码对照表》,如果输入多个语言可用英文逗号,隔开,如:eng,fra,deu
强制OCR:是否强制对整个文档使用 OCR
页面范围:想要识别转换的指定PDF的页码,页码从0开始。如果只想转换PDF文档中的第2页,输入框里可以填1,如果想要转换多个不连续页面的话,可以按下面规则设置:1,5-8,11,即转换第2、6-9、12页的PDF内容。中间为英文逗号,和-
重建OCR:删除文档中所有现有的OCR文本,并使用surya重新进行OCR。
输出格式:软件默认输出md格式,如果想要输出JSON和Html格式的话,可以在下拉列表中选择
启动调试:是否输出软件执行过程中的调试信息。
处理器:
marker.processors.LineBuilder
:用于构建文本行。marker.processors.LineMergeProcessor
:用于合并文本行。marker.processors.LLMTableProcessor
:使用 LLM 处理表格。marker.processors.LLMTableMergeProcessor
:使用 LLM 合并表格。marker.processors.TableProcessor
:用于表格识别和处理。marker.processors.LLMEquationProcessor
:使用 LLM 处理数学公式。marker.processors.LLMInlineMathLinesProcessor
:使用 LLM 处理行内数学公式。marker.processors.LLMMathBlockProcessor
:使用 LLM 处理数学公式块。marker.processors.LLMHandwritingProcessor
:使用 LLM 处理手写内容。marker.processors.LLMImageDescriptionProcessor
:使用 LLM 生成图像描述。marker.processors.LLMFormProcessor
:使用 LLM 处理表单。marker.processors.LLMComplexRegionProcessor
:使用 LLM 处理复杂区域。marker.processors.LLMSimpleBlockMetaProcessor
:使用 LLM 处理简单的块元数据。marker.processors.TableConverter
:用于表格转换。marker.processors.PdfConverter
:用于 PDF 文件转换。
总分块数:指定任务总分块数,用于多任务并行。
文件总数:指定最多处理的 PDF 文件数量。
工作进程数:可以指定同时进行多少个处理任务,每个处理任务占用显存3.5G左右,如果你的显卡显存比较大的话,可以调高这个值,加快处理速度。
跳过已有文件:跳过已存在的转换文件
1.6.1版本整合包增加了对大语言模型的支持,辅助优化生成结果
Google Gemini API申请教程:https://nuowa.net/1431
注意事项:
软件运行主要依赖于GPU,建议英伟达显卡显存在2G以上的用户使用。
如果软件运行中出现:ValueError: max() arg is an empty sequence类似错误,是由于你这个PDF文档排版有问题,无法检测到布局,这是在选择整个文件夹进行批处理中会遇到的问题,如果批处理时某个PDF文档无法处理,你可以选择单独处理这个PDF文档。
支持Windows 10或11,不支持手机和MAC
Marker 1.6.1版一键启动包下载链接:
相关推荐
PDF/图片转markdown软件MonkeyOCR整合包,文档图片解析工具下载
微软PDF/WORD/HTML文档转Markdown格式软件markitdown整合包下载
PDF转Markdown软件MinerU 1.1.0版整合包使用说明视频教程
PDF转Markdown/JSON软件MinerU最新2.1.4版一键启动整合包下载
PDF转Markdown软件zerox整合包,利用在线大语言模型识别转换PDF内容
最新版PDF转Markdown格式软件MinerU一键启动整合包v0.10.0下载
批量PDF文档转MD格式软件marker整合包下载,PDF文件转Markdown格式文件工具
PDF转md格式软件MinerU整合包下载,一键pdf批量转markdown免费工具
最近更新

pixi包管理器简易教程系列:pypi方法安装pytorch
pytorch可以从conda-forge安装,也可以从Pypi安装,看到目前官方页面上安装命令里已经不提供conda的安装命令了,只有pip命令,所以这里用pypi方式安装。 打开项目文件夹内的pixi.toml文件,添加下面命令要求 执...

pixi包管理器简易教程系列:入门之创建项目及激活虚拟环境
pixi是新一代包管理和环境管理工具,安装python依赖包非常快,用了几次感觉还不错,记录一下个人学习使用pixi的一些经验。 Linux系统安装pixi方法 或是 wget -qO- https://pixi.sh/install.sh...

comfyui视频人物换主体工作流及模型下载
本次分享一个好玩的视频人物换主体工作流,本工作流可以使用一张图片中的主体替换视频中的人物主体。比如抖音上很多热门的猴子炒饭,奥特曼炒饭,猴子vlog等等,都可以使用人物主体替换把原来视频中的人物替换成指定的人物。 comfyui工作流节点使...

github.com镜像加速网站,解决无法访问下载速度慢的问题
github.com是全球最大的开源社区,上面有着大量的优秀的开源应用。特别是当前AI极速发展,各种AI应用层出不穷,极大的方便了我们生活办公。但是由于网络原因,有时候github.com从国内可能无法访问,要么就访问速度极慢,不能方便快捷...

comfyui工作流软件官方原版windows版一键启动整合包下载
comfyui是目前非常热门的一个应用,它使python应用可以图形化以节点的方式直接拖拽使用,使用起来非常方便,而且可以与其他python应用节点配合使用,大大丰富了comfyui的功能,而且网上大量平台可以下载到各种的comfyui工作...

视频人物动作迁移wan2.1 VACE comfyUI工作流及模型下载,一键人物动作复刻
本次分享一个非常好玩的视频人物动作迁移comfyui工作流,可以通过文生视频或图片转视频将视频素材中的人物动作复制到新生成的视频人物中,视频生成模型主要使用了wan2.1 VACE模型。 comfyui工作流节点使用说明 首先打开网盘链接将...

凡人修仙传动画韩立高清图片壁纸素材AI绘画图集
恭迎韩天尊! 祝贺韩天尊顺利结婴! 热门国漫凡人修仙传动画已经更新了5年了,最新一集,主人公韩立顺利结婴,成为一名元婴修士。我属于是比较喜欢看动漫的,看过的动漫估计没过百也得大几十了,热门国漫大多都看过。凡人修仙传算是最喜欢的动漫之一,韩立...

凡人修仙传动画紫灵高清图片壁纸素材AI绘画图集,AI国漫女神系列
凡人修仙传动画乱星海第一美女紫灵是大家非常喜欢的一个角色,动画人物造型精美,是众多女性角色中最受欢迎之一,热度极高。很多人喜欢收集紫灵的图片,但是视频里截图的话可能截不到喜欢的图,下面分享一些紫灵的AI绘画图片素材,图片都是SD生成的,都是...

凡人修仙传动画宋玉高清图片壁纸素材AI绘画图集,AI国漫女神系列
凡人修仙传动画里宋玉是大家比较喜欢的一个角色,动画人物造型精美,当前热度极高。虽然凡人修仙传原著里只是韩老魔的弟子,但是很多短视频创作者非常能整活,已经把宋玉纳入韩老魔后宫了。很多人喜欢收集宋玉的图片,但是视频里截图的话可能截不到喜欢的图,...

凡人修仙传动画人物梅凝高清壁纸素材AI绘画图片,AI国漫女神系列
有些人比较喜欢凡人修仙传动画里梅凝这个角色,视频里截图的话可能截不到喜欢的图,下面分享一些梅凝的AI绘画图片素材,图片都是SD生成的,都是高清大图,非凡人修仙传动画视频截图。部分梅凝图片如下: 图片及模型文件下载链接: https://pa...