本工具是一款基于 PDFMathTranslate 与 MinerU 整合的桌面端 PDF 翻译工具,通过简洁的 Web 界面实现一键式 PDF 全文双语翻译,并可选择将翻译结果导出为 Markdown 格式,方便导入知识库或进行二次编辑。

一、功能特点
1. 保持排版的 PDF 双语翻译
- 翻译后的 PDF 保留原始排版、公式、图表位置,生成 mono(单语) 与 dual(双语对照) 两份文件。
- 支持多语言互译,涵盖:简体中文、繁体中文、英语、法语、德语、日语、韩语、俄语、西班牙语、意大利语。
2. 多种翻译服务可选
| 服务 | 说明 |
|---|---|
| 免费服务,无需配置,国内无法使用 | |
| Bing | 免费服务,国内可用 |
| OpenAI | 支持自定义 API Key / Base URL / 模型名称,可使用 DeepSeek、GPT 等大模型翻译,建议使用当前模式,点击此处注册API>> |
3. 批量文件夹处理
- 除单文件模式外,支持输入文件夹路径,自动扫描并批量翻译目录下所有 PDF 文件。
4. 可选 MinerU Markdown 导出
- 开启后,翻译完成后自动调用 MinerU 将 mono PDF 转换为 Markdown 文本。
- 适合将论文、文档导入 Obsidian、Notion、RAG 知识库等场景。
5. 灵活的页码范围
- 支持 全部页面、仅首页、前5页、自定义页码(如
1-3,5,7)四种模式。
6. 配置自动保存
- 点击「开始翻译」后,当前界面所有参数自动保存,下次启动自动恢复。
二、界面与用法
启动方式
双击运行目录下的启动软件.bat
程序将自动在浏览器打开 http://localhost:7860。
操作步骤
- 选择输入模式:
- File:上传单个 PDF 文件。
- Folder:输入文件夹绝对路径(如
D:\documents),批量处理。
- 选择翻译服务:
- 选择 Google / Bing / OpenAI。
- 若选 OpenAI,需填写 API Key、Base URL 和模型名称(如
deepseek-v4-flash),点击此处注册API>>。
- 设置语言:选择源语言与目标语言。
- 设置页码范围(可选):默认翻译全部页面。
- 高级选项(点击展开):
- 线程数:默认 4,可根据 CPU 性能调整。
- 翻译模式:
fast(快速)或precise(精准)。 - 跳过字体子集化:部分字体异常时可尝试勾选。
- 忽略翻译缓存:强制重新翻译,不读取本地缓存。
- 自定义公式字体正则 (vfont):专业排版需求时使用。
- 开启 Markdown 导出:勾选「导出 Markdown 格式」。
- 点击 🚀 开始翻译,等待进度条完成。
- 结果区显示处理日志,最终可在「下载翻译文件」处下载生成的 PDF 或 Markdown
三、输出文件说明
处理完成后,会在程序目录下生成:
pdf2zh_output/—— 存放翻译后的 PDF文件名-mono.pdf:仅目标语言的单语版本文件名-dual.pdf:原文与译文左右/上下对照的双语版本
mineru_output/—— 存放 MinerU 导出的 Markdown(若开启)文件名.md:结构化的 Markdown 文本,保留标题、段落、公式等基本排版
四、注意事项
- 路径与文件名
- 文件夹路径请使用绝对路径,并确保路径中无特殊字符及空格。
- 批量处理时,程序会递归扫描文件夹内所有
.pdf文件。
- MinerU 导出
- MinerU 对扫描版 PDF(图片型)依赖 OCR,识别效果取决于原始清晰度。
- 导出 Markdown 需要一定时间,请耐心等待进度条完成。
- 缓存机制
- 默认会缓存已翻译内容,重复翻译相同文件时会加速完成。
- 如需强制重新翻译,请在高级选项中勾选「忽略翻译缓存」。
- 异常处理
- 若遇到字体或排版异常,可尝试切换「翻译模式」为
precise,或勾选「跳过字体子集化」。 - 出现报错时,请查看控制台日志获取详细错误信息。
- 若遇到字体或排版异常,可尝试切换「翻译模式」为
- 系统支持
- 软件只支持windows 10 或 11,
- 英伟达显卡显存不低于4G,使用前先更新英伟达显卡驱动到最新版
PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown软件下载链接:
相关推荐
最近更新

AutoVidDub支持分角色配音的全自动视频翻译配音加字幕工具
支持分角色配音的全自动流水线,一键将外语视频转为带母语配音和双语字幕的目标语言视频。 一、软件简介 AutoVidDub 是一套运行在本地 GPU 上的全自动视频翻译配音工具。你只需提供一个视频文件,它就能自动完成以下全部工序: 二、核心功...

极速轻便声音克隆语音合成软件MOSS-TTS-Nano整合包,CPU可流畅运行
一、项目概述 MOSS-TTS-Nano 是由 MOSI.AI 与 OpenMOSS 团队 联合开发的开源多语言小模型语音合成系统。模型参数量仅 0.1B,专为实时语音生成场景设计,无需 GPU 即可在 CPU 上直接运行,适合本地演示、W...

最强分说话人语音识别工具,支持批量音视频识别转字幕,字幕翻译内容总结
本软件是一款基于 Qwen3-ASR-1.7B 大模型的本地音视频语音识别工具,配备说话人分离功能,可在个人电脑上实现: 整个流程通过简洁的 Gradio Web 界面 操作,点击按钮即可完成识别与导出。 主要功能特点 1. 单文件识别与批...

最强PR中文视频自动语音识别生成字幕插件,语音识别准确率高支持多国语言
上次和大家分享了PR非常好用的自动剪辑口播视频静音片段插件,如果想要自动生成视频字幕的话,用PR自带的语音识别转字幕工具,效果非常差,语音识别准确率非常低,识别的文本差太多手动修改起来极其麻烦,反而更加浪费时间了。为了提高工作效率,降低人工...

祝贺凡人修仙传2026年新年番开播同时在线人数超64万
今天6月13日凡人修仙传新年番开播,同时在线人数破64万(非最高在线人数,只是我看到的在线人数),作为凡人5年老粉,必须发个帖祝贺一下。 我比较喜欢看动漫,各种类型看了很多,具体不清楚多少,像斗罗斗破之类看了一大半终究是没能看下去,还是雾山...

Premiere Pro静音片段自动剪辑插件——Silence Remover使用教程及下载
对于做口播、Vlog、播客剪辑的朋友来说,最耗时的工作之一就是手动找出视频中的”哑巴”片段——说话间隙、停顿、思考时的”嗯啊”——并逐一删除。今天给大家介绍一款来自 Phantom Edito...

蛙蛙写作-能替你"打工"的AI写作平台,附邀请码:UZekHC
我不是一个容易被工具说服的人。用过 ChatGPT、试过各种”AI写作神器”,大多数要么写出来全是机翻腔,要么根本不懂网文的爆款逻辑。 直到我开始用蛙蛙写作,才发现原来一个工具真的可以懂你想写什么。 🐸 蛙蛙写作是什...

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具
本工具是一款基于 PDFMathTranslate 与 MinerU 整合的桌面端 PDF 翻译工具,通过简洁的 Web 界面实现一键式 PDF 全文双语翻译,并可选择将翻译结果导出为 Markdown 格式,方便导入知识库或进行二次编辑。...

Claude居然自称“本人”
今天在和Claude聊网文写作的时候,Claude回复中居然自称本人,这让我有点震惊。 我经常会和AI聊工具功能对比等话题,ChatGPT、Gemini、Claude这些以前我记得从来没有自称过本人的,好像都是本模型,本工具等等,反正从来没...

图像无损放大神器:Topaz Gigapixel AI软件下载及使用指南
在数字内容创作成风头的今天,我们经常会遇到低分辨率素材模糊、AI 生成图片尺寸太小、或者老照片充满噪点的情况。传统的图像放大方式(如双三次插值)只是单纯地拉伸像素,容易让画面变得模糊、虚化。 如果你正在寻找一种能“凭空”补齐细节、让低画质瞬...












