今天和大家分享一个非常强大的图片文字翻译工具manga-image-translator,这个软件可以一键将图片文字翻译成指定语言文字内容,支持批量图片翻译,快速高效,功能强大。
2025-05-14 更新到当前最新版本,重做UI,修复一些BUG
2026-02-27 更新到最新版,重做UI,功能优化
2026-03-02 增加免费翻译接口,部分功能细节优化
manga-image-translator介绍
manga-image-translator可一键翻译各类图片内文字,可用于漫画翻译,这个软件可以批量将日文漫画英文漫画等一键翻译成中文漫画,也可以翻译成其它语言的漫画,支持几十种语言互翻,翻译后效果非常好,新语言文字画面毫无违和感,简单高效,为方便操作我制作了一个带UI界面的整合包,UI操作界面如下:

翻译效果如下图所示:


以前还和大家分享过另一个图片文字翻译工具《图片漫画翻译工具BallonsTranslator,支持人工校对》,那个翻译工具支持人工手动修改翻译结果,适合对翻译内容准确度要求比较高的人,当前这个manga适合对翻译准确度要求不高,追求批量快速翻译的人使用。
漫画翻译软件manga-image-translator整合包使用说明:
首先将网盘内的软件压缩包下载到本地电脑上并解压出来。双击【启动软件.bat】运行软件。
软件多次更新后,界面参数可能有变化,自行设置了解即可。
【开始】
选择单个图片文件或是文件夹,如果选择文件夹的话,路径地址后面不能有“\”,选择文件夹的话,软件会翻译处理该文件夹内的所有图片。
使用 GPU 加速:默认使用GPU处理,如果英伟达显卡显存在8G以下,请勿勾选
自动上色:为黑白图片自动上色,此为实验性功能。
输出调试图:除了最终结果图片,还会输出很多中间处理图片,供调试参考使用。
跳过错误图像:遇到错误时跳过图像。
字体文件路径:想改变图片文字字体,可以自定义字体文件,路径中不要有非英文字符和空格
翻译前字典:如果有想替换的专有名词,可以在字典文档里设置,每行一对词,配置文件:dict文件夹下pre_dict.txt
格式如下:
# 格式:源词[至少一个Tab/空格]目标词[至少一个Tab/空格][#注释 或 //注释]翻译后字典:图片文字翻译完成后,如果有感觉不准确或是想替换的词,可以在字典里设置,格式和上面格式一致。配置文件:dict文件夹下post_dict.txt
文本区域大小:设置文本擦除区域的卷积内核大小以完全清除文本残留,和【设置】里的卷积核大小重复了,两个参数功能一样。这里的设置可以不用管,用【设置】里的那个参数。
覆盖已翻译图像:如名字所述
跳过无文本图像:跳过没有文本的图像(不会保存)。
保存翻译文本:将翻译的文本保存到文本文件中。方便有些人查看翻译结果。
然后点击开始处理按钮,等待处理即可。处理结果会输出到项目文件夹内的result文件夹,注意这个result文件夹不能删除,否则可能会引起报错。
【设置】
翻译工具:使用哪个在线工具对识别的文字进行翻译,默认使用免费的AI大模型翻译接口,如果对翻译结果不满意,可填写自己申请的API,用户使用量大的话默认免费接口可能会拥挤,发生报错,可填写自己的翻译API。
翻译工具可以使用百度翻译,1分钟就可以申请下来,非常的简单,每个月有100万字符的免费额度,一般人应该够用。点击查看申请流程
《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》
或是使用火爆强大的Deepseek,支持R1和V3模型,现在搞活动,赠大量免费tokens,点击注册>>
deepseek等类OPENAI的大语言模型都填到openai设置里。
MODEL填你使用的模型名
API_KEY和API_BASE_URL根据供应商提供的实际信息填写即可
目标语言:即为最终漫画想显示的语言,语言简写代码如下所示:
目标语言代码
CHS:简体中文
CHT:繁体中文
CSY:捷克语
NLD:荷兰语
ENG:英语
FRA:法语
DEU:德语
HUN:匈牙利语
ITA:意大利语
JPN:日语
KOR:韩语
PLK:波兰语
PTB:葡萄牙语(巴西)
ROM:罗马尼亚语
RUS:俄语
ESP:西班牙语
TRK:土耳其语
UKR:乌克兰语
VIN:越南语
ARA:阿拉伯语
SRP:塞尔维亚语
HRV:克罗地亚语
THA:泰语
IND:印尼语
FIL:菲律宾语(他加禄语)
可以直接在软件目标语言输入框中输入语言代码字母
渲染器:渲染从漫画翻译的文本,生成翻译后的文本图像,并进行额外的排版处理。会忽略某些其他参数选项
对齐方式:文本对齐方式(如左对齐、居中、右对齐等),影响排版美观。
字体大小:字体大小偏移量(如 +2 增大字体,-1 缩小字体),灵活调整文本尺寸,可以在输入框里手动输入其它数值。
文本方向:强制文本方向:h(水平)或 v(垂直)。适用于特定排版需求(如竖排日漫)。
字体颜色:自定义字体颜色,格式为16进制颜色代码,如 FFFFFF(前景色)或 FFFFFF:000000(前景+背景色)。用于解决原图背景干扰问题。
行距比例:行间距为字体大小 * 该值。水平文本默认为0.01,垂直文本默认为0.2,用于调整文本紧凑度。
跳过语言:若原文已是目标语言之一则跳过翻译,使用逗号分隔多个语言。例如:JPN,ENG,可节省时间。
图片放大比例:检测前应用的图像放大比例(如 2),可自行输入想要的数值,可以改善文本检测效果,但会增加显存消耗。
放大器:放大模型(如 waifu2x)。需与 upscale_ratio 配合使用。
恢复放大:翻译后将之前放大的图像缩小回原始大小(与–upscale-ratio配合使用),节省输出文件体积。
旋转图像:旋转图像以优先检测垂直文本行。可能改善检测效果。
反色处理:反转图像颜色进行检测。可能改善检测效果
卷积核大小:设置文本擦除区域的卷积核大小,以完全清理文本残留,默认值为3
文本掩码扩展量:扩展文本遮罩以删除原始图像中剩余文本像素的程度,确保原文本完全覆盖。默认值为30
OCR模型(ocr):使用的光学字符识别(OCR)模型,默认值为48px,可输入的值有:32px,48px,48px_ctc,mocr
【API KEY】
想用哪个翻译工具就输入哪个KEY,基本都可以免费申请使用。输入API 保存后需要重启软件,再去翻译图片,否则不会生效。
使用火爆强大的Deepseek,支持R1和V3模型,现在搞活动,赠大量免费tokens,点击注册>>

BASE URL为:https://api.modelverse.cn/v1/
境外用户也可以使用Google Gemini,资金充裕的也可以使用ChatGPT
视频教程及效果演示:https://nuowa.net/1825
注意事项
英伟达显卡显存6G以上,支持RTX50系列显卡
英伟达显存8G以下用户请勿勾选【使用 GPU 加速】,将使用CPU处理,但速度会变慢
使用前先更新英伟达显卡驱动到最新版本
软件运行路径中不要有非英文字符和空格,待处理及使用的文件同样要注意
整合包只支持Windows 10或11电脑。
漫画图片翻译软件manga-image-translator整合包下载:
相关推荐
一句话编辑图片工具OmniGen2整合包下载,输入文本快速P图
图片漫画翻译工具BallonsTranslator下载,日语英语漫画翻译中文支持人工校对
最新版PDF转Markdown格式软件MinerU一键启动整合包v0.10.0下载
批量PDF文档转MD格式软件marker整合包下载,PDF文件转Markdown格式文件工具
人脸图片处理换脸软件facefusion整合包下载,改变年龄重建表情工具
本地文档聊天对话软件localGPT整合包下载,大语音模型文档内容分析总结
免费文字转语音软件EmotiVoice整合包下载,TTS情感语音合成工具
2D图片转3D模型软件,AI建模工具Wonder3D整合包下载
最近更新

ComfyUI 三参考图生图工作流,虚拟试衣、换脸、图片内容整合
本工作流核心能力是将三张不同角度、内容的参考图,通过 AI 理解融合,生成一张新的图像,新图像内容根据描述词指令生成。工作流集成了阿里巴巴的 Qwen2.5-VL 多模态大模型(图像编辑版本)与 SeedVR2 超分辨率放大模型,实现了「理...
comfyui CUDA128+torch 2.8.0+python3.12最新纯净版一键启动整合包
comfyui官方发布的最新版便携包是基于torch 2.11+CU130 +Python 3.13版本制作的,Python版本和torch版本都太新了,windows电脑上安装某些节点的时候会有冲突报错,有时候就算能安装上也会比较麻烦,感...
LTX2.3+comfyui音频驱动视频生成工作流
这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...
LTX2.3+comfyui分段提示词图片转视频工作流,AI视频带货生成器
再和大家分享一个基于 ComfyUI 的 AI 分段提示词图生视频工作流,本工作流主要基于模型LTX2.3和PromptRelay实现。可使用PromptRelay分时段控制生成不同视频画面或合成语音内容。 📌 工作流简介 本工作流是一套基...
windows电脑C盘垃圾查找清理软件
电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...

LTX2.3+comfyui视频去除字幕水印工作流分享
本次再和大家分享一个视频去字幕水印的comfyui工作流,工作流基于LTX2.3视频生成模型制作。LTX2.3是最新最强的视频生成模型,我前段时间就分享过了,可以看我另一篇文章:https://nuowa.net/2525,comfyui项...

多人对话声音克隆语音合成工具Chatterbox TTS免安装版,AI实时文字转语音
Chatterbox 是由 Resemble AI 开发的开源文本转语音(Text-to-Speech, TTS)模型,支持零样本音色克隆:只需提供一段参考音频(几秒钟的人声),即可模仿该音色朗读任意文本。我基于最新版源码制作了免安装一键启...
Mineru PDF转markdown软件局域网版
对于有的电脑配置比较低或是win7系统等电脑无法使用Mineru情况,可以使用局域网内可运行软件的电脑运行Mineru,然后其它电脑或手机等终端输入IP地址,打开运行软件的IP地址来使用Mineru。 具体用法: 下载局域网版压缩包到本地电...

OmniSVG:统一的可缩放矢量图形生成软件
OmniSVG 是一个基于视觉-语言模型(VLM)的端到端多模态 SVG(可缩放矢量图形)生成框架,由 OpenVGLab 团队开发。该项目能够从文本描述或参考图像生成高质量的 SVG 矢量图形,覆盖从简单图标...

AI实时变声器Voice Changer2.1.4 CUDA版下载,高质量RVC变声软件
Voice Changer是一款实时 AI 变声工具,允许你通过多种 AI 声音模型(如 RVC 和 Beatrice)实时转换声音。转换延迟更低,是目前社区中最受欢迎的开源实时变声方案之一。 核心特点 1. 实时性 voice-chang...


















