 

当前位置：诺瓦小站  VIP资源  专属软件  正文

AutoVidDub支持分角色配音的全自动视频翻译配音加字幕工具

2026-06-28 分类：专属软件评论(0)

支持分角色配音的全自动流水线，一键将外语视频转为带母语配音和双语字幕的目标语言视频。

一、软件简介

AutoVidDub 是一套运行在本地 GPU 上的全自动视频翻译配音工具。你只需提供一个视频文件，它就能自动完成以下全部工序：

语音识别 + 说话人分离 — 谁在什么时候说了什么，逐字时间戳对齐
字幕切分 — 合理的断句方案，即不影响观看也不妨碍理解文字内容
AI 翻译 — 调用大语言模型 API 将原文翻译为目标语言，翻译更准确
TTS 音色克隆配音 — 保持原说话人的音色、语气，用目标语言重新朗读
时间轴对齐 — 合理处理配音，让每句话精确落在原时间槽内，不截断句子
视频合成 — 合并配音轨 + 可选烧录双语字幕，输出最终视频

二、核心功能特点

🌟 分角色配音

自动识别视频中有几个说话人，为每个说话人提取音色参考。合成配音时，张三说的话用张三的音色读目标语言，李四的话用李四的音色，保留原声的情感语气。

🌟 双语字幕 + 配音同步

生成双语 SRT 字幕（原文在上、翻译在下），同时用目标语言合成配音。时间轴对齐无截断，确保每句话完整可懂。

🌟 10 种翻译目标语言

视频支持52种语言方言的语音识别，TTS配音合成支持 10 种语言：

语言	ASR 识别	翻译目标	TTS 配音
中文	✅	✅	✅
英语	✅	✅	✅
日语	✅	✅	✅
韩语	✅	✅	✅
法语	✅	✅	✅
德语	✅	✅	✅
西班牙语	✅	✅	✅
葡萄牙语	✅	✅	✅
意大利语	✅	✅	✅
俄语	✅	✅	✅

🌟 灵活的视频合成

可选择是否烧录字幕到最终视频：勾选则生成带双语字幕的配音视频；不勾选则只合成画面 + 配音，字幕以独立的 SRT 文件保存，可后期自行处理。

🌟 两步操作设计

界面分为两步独立操作：

生成字幕（ASR + 翻译 + 导出 SRT）—— 只需 ASR 模型，速度快
合成配音（TTS + 对齐 + 视频合成）—— 需要 TTS 模型，检查第一步生成的 SRT 文件存在后才会执行

两步独立完成，第二步会先检查第一步是否已完成；关掉程序重新打开后，只要第一步生成的 SRT 文件还在，可以直接跳过第一步执行第二步。

🌟 支持批量处理

既支持单个视频文件，也支持文件夹批量处理。选择文件夹后，自动遍历文件夹内全部 mp4/avi/mov/mkv/flv/wmv/webm 文件，逐个全自动处理。

三、界面说明

📂 输入设置

控件	说明
输入方式	单文件上传 / 文件夹批量处理
上传视频文件	支持 .mp4/.avi/.mov/.mkv/.flv/.wmv/.webm
文件夹路径	批量处理时输入文件夹路径

⚙️ 识别参数

控件	说明
ASR 识别语言	可手动指定原视频语言，列表里没有的可选自动识别（推荐）
翻译目标语言	选择最终视频的目标语言（10 种可选）

🔤 字幕字体设置

控件	说明
原语言字体	烧录到视频时原文使用什么字体
翻译语言字体	翻译文本在视频中显示的字体

🌐 API 设置

控件	说明
API Key	LLM 翻译的 API 密钥，点击注册>>
Model Name	模型名称（默认 deepseek-v4-flash）
Base URL	API 地址（默认https://api.modelverse.cn/v1/ ）

▶️ 处理控制

控件	说明
烧录字幕	勾选则在视频中硬编码字幕；不勾选则只产出声画合成的配音视频
第一步：生成字幕	ASR + 翻译 + 导出 .bilingual.srt
第二步：合成配音	TTS配音 + 混音 + 合成最终视频

四、使用步骤

0️⃣ 准备工作

NVIDIA GPU 推荐：模型推理需要 GPU（CUDA），显存建议 ≥6GB
获取 API Key：点击”获取 API KEY“链接注册并创建密钥
将软件压缩包下载到本地电脑上并解压，双击启动软件.bat自动打开webui操作界面

1️⃣ 选择输入

处理单个文件：输入方式选”单文件上传”，点击上传按钮选择视频
批量处理：输入方式选”文件夹批量处理”，填入存放视频的文件夹路径

2️⃣ 配置参数

选择原视频的 ASR 识别语言（一般选”自动识别”即可）
选择翻译目标语言（如”中文”）
填入 API Key（翻译必须）
根据需要选字体、勾选是否烧录字幕

3️⃣ 第一步：生成字幕

点击 “📝 第一步：生成字幕”。程序依次执行：

提取音频 → 说话人分离 → ASR 语音识别 → 字幕切分 → AI 逐条翻译 → 导出双语 SRT + 数据文件

在第5步（翻译）时确保有 API Key 可用。完成后输出目录 output/<视频文件名>/ 中会生成双语字幕 .bilingual.srt 。

4️⃣ 第二步：合成配音

点击 “🎙️ 第二步：合成配音”，程序会自动：

检查第一步的 SRT 文件是否存在（不存在则提示）
提取音频用于音色参考 → 构建说话人音色管理器 → TTS 批量合成配音
时间轴按比例对齐 → 合并完整配音轨 → 合成最终视频

最终产出：

output/<视频文件名>/<文件名>_dubbed.mp4 — 最终配音视频
output/<视频文件名>/<文件名>_dubbed.wav — 完整配音音频（可单独使用）
output/<视频文件名>/<文件名>.bilingual.srt — 双语字幕文件

五、注意事项

⚠️ 硬件要求

推荐英伟达显卡显存 ≥6GB
CPU 模式可用但极慢
模型首次加载较慢，属于正常现象

⚠️ 已知限制

目前仅支持单声道 16kHz 音频处理
背景音乐/噪音严重的视频可能影响 ASR 准确率和音色提取效果

AutoVidDub全自动视频翻译配音加字幕工具v0.1版下载链接

此内容仅限VIP查看，请先

可通过每日签到获得积分兑换VIP

有任何使用中的问题可随时向我反馈，我会在后续版本中优化改进

AI软件用不了？2元爽玩4090：立即体验>>

热门大语言模型API免费体验：立即获取>>

软件催更及1对1人工答疑支持： https://nuowa.net/1806

赞(0)  打赏

软件无法使用？点击查看常见问题说明>>

分享到

相关推荐

最近更新

Claude 再放大招，Sonnet 5 来了

一觉醒来Anthropic又放大招了，Claude Sonnet 5来了。不得不说国外大语言模型更新的是真快的，各家LLM版本更新迭代频率都很高，Claude 刚发布Opus 4.8 不久，这又发布了Sonnet 5.Anthropic ...

赞(0)2026-07-01趣站

AutoVidDub支持分角色配音的全自动视频翻译配音加字幕工具

支持分角色配音的全自动流水线，一键将外语视频转为带母语配音和双语字幕的目标语言视频。一、软件简介 AutoVidDub 是一套运行在本地 GPU 上的全自动视频翻译配音工具。你只需提供一个视频文件，它就能自动完成以下全部工序：二、核心功...

赞(0)2026-06-28专属软件

极速轻便声音克隆语音合成软件MOSS-TTS-Nano整合包，CPU可流畅运行

一、项目概述 MOSS-TTS-Nano 是由 MOSI.AI 与 OpenMOSS 团队联合开发的开源多语言小模型语音合成系统。模型参数量仅 0.1B，专为实时语音生成场景设计，无需 GPU 即可在 CPU 上直接运行，适合本地演示、W...

赞(0)2026-06-27AI音频

最强分说话人语音识别工具，支持批量音视频识别转字幕，字幕翻译内容总结

本软件是一款基于 Qwen3-ASR-1.7B 大模型的本地音视频语音识别工具，配备说话人分离功能，可在个人电脑上实现：整个流程通过简洁的 Gradio Web 界面操作，点击按钮即可完成识别与导出。主要功能特点 1. 单文件识别与批...

赞(1)2026-06-21AI音频

最强PR中文视频自动语音识别生成字幕插件，语音识别准确率高支持多国语言

上次和大家分享了PR非常好用的自动剪辑口播视频静音片段插件，如果想要自动生成视频字幕的话，用PR自带的语音识别转字幕工具，效果非常差，语音识别准确率非常低，识别的文本差太多手动修改起来极其麻烦，反而更加浪费时间了。为了提高工作效率，降低人工...

赞(0)2026-06-15专属软件

祝贺凡人修仙传2026年新年番开播同时在线人数超64万

今天6月13日凡人修仙传新年番开播，同时在线人数破64万（非最高在线人数，只是我看到的在线人数），作为凡人5年老粉，必须发个帖祝贺一下。我比较喜欢看动漫，各种类型看了很多，具体不清楚多少，像斗罗斗破之类看了一大半终究是没能看下去，还是雾山...

赞(1)2026-06-13趣站

Premiere Pro静音片段自动剪辑插件——Silence Remover使用教程及下载

对于做口播、Vlog、播客剪辑的朋友来说，最耗时的工作之一就是手动找出视频中的”哑巴”片段——说话间隙、停顿、思考时的”嗯啊”——并逐一删除。今天给大家介绍一款来自 Phantom Edito...

赞(0)2026-06-11实用软件

蛙蛙写作-能替你"打工"的AI写作平台，附邀请码：UZekHC

我不是一个容易被工具说服的人。用过 ChatGPT、试过各种”AI写作神器”，大多数要么写出来全是机翻腔，要么根本不懂网文的爆款逻辑。直到我开始用蛙蛙写作，才发现原来一个工具真的可以懂你想写什么。 🐸 蛙蛙写作是什...

赞(0)2026-06-09趣站

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具

本工具是一款基于 PDFMathTranslate 与 MinerU 整合的桌面端 PDF 翻译工具，通过简洁的 Web 界面实现一键式 PDF 全文双语翻译，并可选择将翻译结果导出为 Markdown 格式，方便导入知识库或进行二次编辑。...

赞(1)2026-06-09专属软件

Claude居然自称“本人”

今天在和Claude聊网文写作的时候，Claude回复中居然自称本人，这让我有点震惊。我经常会和AI聊工具功能对比等话题，ChatGPT、Gemini、Claude这些以前我记得从来没有自称过本人的，好像都是本模型，本工具等等，反正从来没...

赞(1)2026-06-05趣站