批量音频视频语音转文字软件faster-whisper整合包下载，精准快速语音转录工具-诺瓦小站

Faster-whisper距离我上次分享已经过去挺长时间了，而且中间也更新了多次了，看到Faster-whisper昨天刚更新了一下，更新内容有模型更新和处理速度大幅提升，更新内容还是挺重要的，我就做了一个最新版本的一键启动包，同时我对整合包功能也做了些修改和优化。

2025-09-02

faster-whisper更新至最新1.2版，新增支持本地ollama大语言模型翻译功能

2026-04-01

源码更新到最新版，重做UI，功能及设置上一些优化

文章目录 隐藏

1 Faster-whisper语音转录工具介绍

2 Faster-whisper更新说明

3 Faster-whisper整合包使用说明

4 注意事项

5 语音识别转文字软件faster-whisper一键启动包下载链接

6 在线一键启动

Faster-whisper语音转录工具介绍

faster-whisper是使用CTranslate2对 OpenAI 的 Whisper 模型的重新实现，是 Whisper 的一个优化版本，它是 Transformer 模型的快速推理引擎，用于实现语音识别。此实现比openai/whisper快 4 倍，且精度相同，同时占用的内存更少。在 CPU 和 GPU 上采用 8 位量化，效率可进一步提高。

主要功能

语音转录：
- 将语音文件（如 MP3、WAV）转换为文本。
- 支持多语言语音转录。
语言检测：
- 自动检测输入音频的语言，无需手动指定语言。
分段处理：
- 能够将长音频分成多个片段进行处理，从而提升处理效率和内存利用率。

Faster-whisper特点

高效优化：
- 使用 CTranslate2 后端来加速模型推理，显著提升了运行速度。
- 支持 GPU 和 CPU 加速，充分利用硬件资源。
轻量化：
- 更小的模型大小和更低的资源需求，适合嵌入式设备或低性能机器。
灵活性：
- 允许用户选择不同的模型大小（tiny、base、small、medium、large）以平衡速度和精度。
多语言支持：
- 支持 Whisper 所有的多语言模型，适用于不同语言的转录需求。

Faster-whisper更新说明

Faster-whisper最近发布的版本更新内容有如下方面：

1.2.0更新内容

feat：允许通过特定修订版本进行下载
支持distil-large-v3.5
功能：允许通过以下方式加载私有 HF 模型
错误修复：通过以下方式恢复时间戳时获取正确的块索引
通过批量转录删除静音

1.1.1更新内容

恢复原始 VAD 参数命名
使批量 suppress_tokens 行为与顺序相同
修复 OOM 错误 – VAD 的 RAM 使用率过高
将音频持续时间和 VAD 移除持续时间添加到 BatchedInferencePipeline
修复 neg_threshold

1.1.0新功能

新的分批推理速度提高了 4 倍，而且准确度也提高了
支持新large-v3-turbo模型。
VAD 过滤器现在在 CPU 上的运行速度提高了 3 倍。
特征提取速度现在提高了 3 倍。
已添加log_progress到WhisperModel.transcribe打印转录进度。
添加了multilingual转录选项，允许转录多语言音频。请注意，大型模型已经具有代码转换功能，因此这对medium模型或较小的模型最有益。
WhisperModel.detect_language现在可以选择使用 VAD 过滤器，并改进使用language_detection_segments和的语言检测language_detection_threshold。

问题修复

chunk_length在<30 秒时使用正确的特征填充编码器输入
seek在输出中使用正确的值

Faster-whisper整合包使用说明

首先将网盘内的压缩包下载到电脑解压出来，然后运行【启动软件.bat】。软件支持处理多种格式音视频文件，格式如下："*.mp3", "*.wav", "*.flac", "*.aac", "*.m4a", "*.mp4", "*.mkv", "*.avi", "*.mov"

。也支持批量处理。可以将需要处理的音视频文件鼠标左键按住拖动到软件窗口中。或是在输入框内输入需要批量处理的文件夹。

选择模型：默认使用的medium模型，如果你感觉识别效果不满意的话可以使用更大的模型，模型越大识别越精准，但是对电脑配置要求也越高。

选择其它模型软件会自动下载模型文件，如果你无法访问huggingface的话，就无法自动下载模型文件，可以到我网盘内【models】文件夹内手动下载模型压缩包文件到本地电脑项目文件夹【models】内解压，解压后的文件夹路径参考：

faster-whisper20260331–>models–>large-v3–>model.bin

文件夹不要有多余的嵌套，否则无法识别文件

batch size:就是批处理大小，值越大，处理速度越快，但是对电脑配置要求也越高。默认值为4，相对较小。可以根据你电脑显存使用情况适当调高该值。

翻译工具：如果想要把识别文本翻译成其它语言，可以选择翻译工具进行翻译，可以免费使用bing翻译，不过机器翻译效果略差。你也可以使用大语言模型翻译，不过需要申请API，如果还没有大语言模型API的话，你可以点击立即申请>>

硅基流动模型 Base URL:

https://api.siliconflow.cn/v1/

API KEY 填你个人实际API KEY值

Model name填你想要使用的模型名，如：

Pro/MiniMaxAI/MiniMax-M2.5

你有其他的deepseek等兼容openai API的都可以

翻译目标语言：想把识别出的文本翻译成什么语言的文本

支持识别导出为SRT字幕文件，可按需开启

点击【开始识别】按钮后软件就会开始处理选定的内容，识别结果保存在项目文件夹内的outputs文件夹内。

软件处理过程为本地电脑处理，如果不需要下载模型文件的话，可离线使用本软件

整合包更新内容：

相对于我分享的上个整合包，本次分享的整合包版本有了多处升级。

1、新增批量处理功能，直接选择文件夹，软件就会处理文件夹内的所有音视频文件。仅是MP4格式视频和音频类型文件，不要有其它类型文件。

2、新增batch size和计算精度选项，对高配电脑更加友好，处理效率更高

3、优化字幕生成算法，启用字级时间戳，生成的字幕更准确更友好。

4、增加对最新模型large-v3-turbo模型的支持

5、其它细节上的一些优化。

注意事项

整合包只支持Windows 10或11

软件运行路径中不要有非英文字符和空格

支持英伟达50X系列显卡，使用前请先将英伟达显卡驱动更新到最新版本，否则可能会报错

语音发音不标准、音频声音不干净等原因可能会导致输出繁体中文，可尝试更换更大的模型

如果选择处理文件夹，文件夹内不要有音频、视频以外的文件类型

本软件建议用于英文等外国语言识别，如果识别中文建议使用另一款：https://nuowa.net/721

语音识别转文字软件faster-whisper一键启动包下载链接

此内容仅限VIP查看，请先

可通过每日签到获得积分兑换VIP

在线一键启动

点击使用云镜像>>

AI软件用不了？2元爽玩4090：立即体验>>

热门大语言模型API免费体验：立即获取>>

软件催更及1对1人工答疑支持： https://nuowa.net/1806

批量音频视频语音转文字软件faster-whisper整合包下载，精准快速语音转录工具

Faster-whisper语音转录工具介绍

Faster-whisper更新说明

Faster-whisper整合包使用说明

注意事项

语音识别转文字软件faster-whisper一键启动包下载链接

在线一键启动

相关推荐

最近更新

Claude 再放大招，Sonnet 5 来了

AutoVidDub支持分角色配音的全自动视频翻译配音加字幕工具

极速轻便声音克隆语音合成软件MOSS-TTS-Nano整合包，CPU可流畅运行

最强分说话人语音识别工具，支持批量音视频识别转字幕，字幕翻译内容总结

最强PR中文视频自动语音识别生成字幕插件，语音识别准确率高支持多国语言

祝贺凡人修仙传2026年新年番开播同时在线人数超64万

Premiere Pro静音片段自动剪辑插件——Silence Remover使用教程及下载

蛙蛙写作-能替你"打工"的AI写作平台，附邀请码：UZekHC

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具

Claude居然自称“本人”

热门文章

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏，我将有更多的动力继续提供优质内容，让我们一起创建更加美好的世界！

支付宝扫一扫

微信扫一扫