本工具是一款基于 PDFMathTranslate 与 MinerU 整合的桌面端 PDF 翻译工具,通过简洁的 Web 界面实现一键式 PDF 全文双语翻译,并可选择将翻译结果导出为 Markdown 格式,方便导入知识库或进行二次编辑。

一、功能特点
1. 保持排版的 PDF 双语翻译
- 翻译后的 PDF 保留原始排版、公式、图表位置,生成 mono(单语) 与 dual(双语对照) 两份文件。
- 支持多语言互译,涵盖:简体中文、繁体中文、英语、法语、德语、日语、韩语、俄语、西班牙语、意大利语。
2. 多种翻译服务可选
| 服务 | 说明 |
|---|---|
| 免费服务,无需配置,国内无法使用 | |
| Bing | 免费服务,国内可用 |
| OpenAI | 支持自定义 API Key / Base URL / 模型名称,可使用 DeepSeek、GPT 等大模型翻译,建议使用当前模式,点击此处注册API>> |
3. 批量文件夹处理
- 除单文件模式外,支持输入文件夹路径,自动扫描并批量翻译目录下所有 PDF 文件。
4. 可选 MinerU Markdown 导出
- 开启后,翻译完成后自动调用 MinerU 将 mono PDF 转换为 Markdown 文本。
- 适合将论文、文档导入 Obsidian、Notion、RAG 知识库等场景。
5. 灵活的页码范围
- 支持 全部页面、仅首页、前5页、自定义页码(如
1-3,5,7)四种模式。
6. 配置自动保存
- 点击「开始翻译」后,当前界面所有参数自动保存,下次启动自动恢复。
二、界面与用法
启动方式
双击运行目录下的启动软件.bat
程序将自动在浏览器打开 http://localhost:7860。
操作步骤
- 选择输入模式:
- File:上传单个 PDF 文件。
- Folder:输入文件夹绝对路径(如
D:\documents),批量处理。
- 选择翻译服务:
- 选择 Google / Bing / OpenAI。
- 若选 OpenAI,需填写 API Key、Base URL 和模型名称(如
deepseek-v4-flash),点击此处注册API>>。
- 设置语言:选择源语言与目标语言。
- 设置页码范围(可选):默认翻译全部页面。
- 高级选项(点击展开):
- 线程数:默认 4,可根据 CPU 性能调整。
- 翻译模式:
fast(快速)或precise(精准)。 - 跳过字体子集化:部分字体异常时可尝试勾选。
- 忽略翻译缓存:强制重新翻译,不读取本地缓存。
- 自定义公式字体正则 (vfont):专业排版需求时使用。
- 开启 Markdown 导出:勾选「导出 Markdown 格式」。
- 点击 🚀 开始翻译,等待进度条完成。
- 结果区显示处理日志,最终可在「下载翻译文件」处下载生成的 PDF 或 Markdown
三、输出文件说明
处理完成后,会在程序目录下生成:
pdf2zh_output/—— 存放翻译后的 PDF文件名-mono.pdf:仅目标语言的单语版本文件名-dual.pdf:原文与译文左右/上下对照的双语版本
mineru_output/—— 存放 MinerU 导出的 Markdown(若开启)文件名.md:结构化的 Markdown 文本,保留标题、段落、公式等基本排版
四、注意事项
- 路径与文件名
- 文件夹路径请使用绝对路径,并确保路径中无特殊字符及空格。
- 批量处理时,程序会递归扫描文件夹内所有
.pdf文件。
- MinerU 导出
- MinerU 对扫描版 PDF(图片型)依赖 OCR,识别效果取决于原始清晰度。
- 导出 Markdown 需要一定时间,请耐心等待进度条完成。
- 缓存机制
- 默认会缓存已翻译内容,重复翻译相同文件时会加速完成。
- 如需强制重新翻译,请在高级选项中勾选「忽略翻译缓存」。
- 异常处理
- 若遇到字体或排版异常,可尝试切换「翻译模式」为
precise,或勾选「跳过字体子集化」。 - 出现报错时,请查看控制台日志获取详细错误信息。
- 若遇到字体或排版异常,可尝试切换「翻译模式」为
- 系统支持
- 软件只支持windows 10 或 11,
- 英伟达显卡显存不低于4G,使用前先更新英伟达显卡驱动到最新版
PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown软件下载链接:
相关推荐
最近更新

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具
本工具是一款基于 PDFMathTranslate 与 MinerU 整合的桌面端 PDF 翻译工具,通过简洁的 Web 界面实现一键式 PDF 全文双语翻译,并可选择将翻译结果导出为 Markdown 格式,方便导入知识库或进行二次编辑。...

Claude居然自称“本人”
今天在和Claude聊网文写作的时候,Claude回复中居然自称本人,这让我有点震惊。 我经常会和AI聊工具功能对比等话题,ChatGPT、Gemini、Claude这些以前我记得从来没有自称过本人的,好像都是本模型,本工具等等,反正从来没...

图像无损放大神器:Topaz Gigapixel AI软件下载及使用指南
在数字内容创作成风头的今天,我们经常会遇到低分辨率素材模糊、AI 生成图片尺寸太小、或者老照片充满噪点的情况。传统的图像放大方式(如双三次插值)只是单纯地拉伸像素,容易让画面变得模糊、虚化。 如果你正在寻找一种能“凭空”补齐细节、让低画质瞬...

AI视频提示词反推工具,参考视频即梦提示词一键生成
本工具是一款面向 AI 视频生成创作者的本地离线辅助软件。用户导入任意视频文件,工具会自动完成场景检测、关键帧提取、多模态模型分析、提示词拼装等全流程,最终输出一份可直接复制粘贴到即梦 AI 等视频生成平台的完整提示词。 适用场景 功能特点...
免费在线HTML转markdown工具
经常看一些在线文档,想复制给AI参考的话不方便直接复制,转换成markdown再给AI阅读会更简单明了,也方便自己查阅,这里给大家推荐两个在线的免费HTML转markdown网站。 1、https://d1tools.com/tools/c...

闲鱼自动回复机器人XianyuAutoAgent下载,24小时在线智能客服机器人系统
XianyuAutoAgent是一款面向闲鱼平台的智能化自动回复机器人,利用大语言模型自动识别买家意图并生成专业回复,实现 7×24 小时智能客服。 主要功能 1. 智能自动回复 2. 可视化 Web UI 3. 人工接管模式 4. 安全防...

AI漫剧制作即梦seedance2.0教程及提示词2026年5月最新版分享
AI视频依旧持续火爆,各种类型的AI视频层出不穷,视频效果也是越来越好,甚至快接近影视级,目前最主要的AI视频生成工具还是即梦,即梦 Seedance 2.0生成视频一秒钟都到2块多钱了😂,不过也没办法,还是得用,目前还没能有替代即梦see...

AI实时语音聊天对话系统,外语口语陪练/虚拟好友实时语音交流
AI 实时语音对话系统 是一款集语音识别(ASR)、大语言模型(LLM)对话、语音合成(TTS)于一体的实时语音交互软件。用户通过麦克风说话,系统自动识别语音内容并转为文字,交由 AI 角色进行智能回复,最终将回复内容合成为语音实时播放,实...

ComfyUI 三参考图生图工作流,虚拟试衣、换脸、图片内容整合
本工作流核心能力是将三张不同角度、内容的参考图,通过 AI 理解融合,生成一张新的图像,新图像内容根据描述词指令生成。工作流集成了阿里巴巴的 Qwen2.5-VL 多模态大模型(图像编辑版本)与 SeedVR2 超分辨率放大模型,实现了「理...
comfyui CUDA128+torch 2.8.0+python3.12最新纯净版一键启动整合包
comfyui官方发布的最新版便携包是基于torch 2.11+CU130 +Python 3.13版本制作的,Python版本和torch版本都太新了,windows电脑上安装某些节点的时候会有冲突报错,有时候就算能安装上也会比较麻烦,感...














