faster-whisper是基于OpenAI的whisper的优化版本,faster-whisper使用CTranslate2对 OpenAI 的 Whisper 模型的重新实现,它是 Transformer 模型的快速推理引擎。在相同准确率下,该实现比openai/whisper快 4 倍,同时占用更少的内存。在 CPU 和 GPU 上均采用 8 位量化,效率可进一步提高。
以下是使用不同实现方式转录13 分钟音频所需的时间和内存使用测试结果,测试设备为NVIDIA Tesla V100S,模型为Large-v2:
测试工具 | 精确 | Beam size | 时间 | 最大GPU显存 | 最大CPU内存 |
---|---|---|---|---|---|
openai/whisper | fp16 | 5 | 4m30s | 11325MB | 9439MB |
faster-whisper | fp16 | 5 | 54s | 4755MB | 3244MB |
faster-whisper | int8 | 5 | 59s | 3091MB | 3117MB |
可以明显的看出faster-whisper的执行速度是有非常大的提升的,快了近5倍了。这个应用是非常好的一个工具了,我制作了最新版的faster-whisper一键启动整合包,操作界面如下:

软件支持音频文件和视频文件的语音转文字
默认使用模型为small,模型越大识别效果越好,但是对电脑配置要求也越高,如果想使用更大的模型,需要到网盘里将另外两个模型下载到项目文件夹里huggingface文件夹内,
软件支持将识别的内容翻译为其它语言,可选的翻译工具有百度翻译和谷歌翻译,国内用户可用百度翻译,国外用户可用谷歌翻译。使用百度翻译需要先申请APP ID和密钥,可以看这篇文章《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》,将申请到的APP ID和密钥填到软件里即可使用百度翻译功能。
如使用翻译功能必须填写下面的目标语言,软件里我只预设了少量几种语言,但是百度和谷歌支持几十种语言的翻译,你可以将语言代码直接填到目标语言输入框里。百度和谷歌翻译的语言代码如下:
百度翻译语言代码列表
语言代码 | 名称 |
---|---|
zh | 中文 |
en | 英语 |
yue | 粤语 |
wyw | 文言文 |
jp | 日语 |
kor | 韩语 |
fra | 法语 |
spa | 西班牙语 |
th | 泰语 |
ara | 阿拉伯语 |
ru | 俄语 |
pt | 葡萄牙语 |
de | 德语 |
it | 意大利语 |
el | 希腊语 |
nl | 荷兰语 |
pl | 波兰语 |
bul | 保加利亚语 |
est | 爱沙尼亚语 |
dan | 丹麦语 |
fin | 芬兰语 |
cs | 捷克语 |
rom | 罗马尼亚语 |
slo | 斯洛文尼亚语 |
swe | 瑞典语 |
hu | 匈牙利语 |
cht | 繁体中文 |
vie | 越南语 |
Google翻译语言代码列表
语言 | 代码 |
---|---|
南非荷兰语 | af |
阿尔巴尼亚语 | sq |
阿姆哈拉语 | am |
阿拉伯语 | ar |
亚美尼亚文 | hy |
阿萨姆语 | as |
艾马拉语 | ay |
阿塞拜疆语 | az |
班巴拉语 | bm |
巴斯克语 | eu |
白俄罗斯语 | be |
孟加拉文 | bn |
博杰普尔语 | bho |
波斯尼亚语 | bs |
保加利亚语 | bg |
加泰罗尼亚语 | ca |
宿务语 | ceb |
中文(简体) | zh-CN |
中文(繁体) | zh-TW |
科西嘉语 | co |
克罗地亚语 | hr |
捷克语 | cs |
丹麦语 | da |
迪维希语 | dv |
多格来语 | doi |
荷兰语 | nl |
英语 | en |
世界语 | eo |
爱沙尼亚语 | et |
Ewe | ee |
菲律宾语(塔加拉语) | fil |
芬兰语 | fi |
法语 | fr |
弗里斯兰语 | fy |
加利西亚语 | gl |
格鲁吉亚语 | ka |
德语 | de |
希腊文 | el |
瓜拉尼人 | gn |
古吉拉特文 | gu |
海地克里奥尔语 | ht |
Hausa | ha |
夏威夷语 | haw |
希伯来语 | he 或 iw |
印地语 | hi |
苗语 | hmn |
匈牙利语 | hu |
冰岛语 | is |
伊博语 | ig |
伊洛卡诺语 | ilo |
印度尼西亚语 | id |
爱尔兰语 | ga |
意大利语 | it |
日语 | ja |
爪哇语 | jv 或 jw |
卡纳达文 | kn |
哈萨克语 | kk |
高棉语 | km |
卢旺达语 | rw |
Konkani | gom |
韩语 | ko |
Krio | kri |
库尔德语 | ku |
库尔德语(索拉尼) | ckb |
吉尔吉斯语 | ky |
老挝语 | lo |
拉丁文 | la |
拉脱维亚语 | lv |
林加拉语 | ln |
立陶宛语 | lt |
卢干达语 | lg |
卢森堡语 | lb |
马其顿语 | mk |
迈蒂利语 | mai |
马尔加什语 | mg |
马来语 | ms |
马拉雅拉姆文 | ml |
马耳他语 | mt |
毛利语 | mi |
马拉地语 | mr |
梅泰语(曼尼普尔语) | mni-Mtei |
米佐语 | lus |
蒙古文 | mn |
缅甸语 | my |
尼泊尔语 | ne |
挪威语 | no |
尼杨扎语(齐切瓦语) | ny |
奥里亚语(奥里亚) | or |
奥罗莫语 | om |
普什图语 | ps |
波斯语 | fa |
波兰语 | pl |
葡萄牙语(葡萄牙、巴西) | pt |
旁遮普语 | pa |
克丘亚语 | qu |
罗马尼亚语 | ro |
俄语 | ru |
萨摩亚语 | sm |
梵语 | sa |
苏格兰盖尔语 | gd |
塞佩蒂语 | nso |
塞尔维亚语 | sr |
塞索托语 | st |
修纳语 | sn |
信德语 | sd |
僧伽罗语 | si |
斯洛伐克语 | sk |
斯洛文尼亚语 | sl |
索马里语 | so |
西班牙语 | es |
巽他语 | su |
斯瓦希里语 | sw |
瑞典语 | sv |
塔加路语(菲律宾语) | tl |
塔吉克语 | tg |
泰米尔语 | ta |
鞑靼语 | tt |
泰卢固语 | te |
泰语 | th |
提格里尼亚语 | ti |
Tsonga | ts |
土耳其语 | tr |
土库曼语 | tk |
契维语(阿坎语) | ak |
乌克兰语 | uk |
乌尔都语 | ur |
维吾尔语 | ug |
乌兹别克语 | uz |
越南语 | vi |
威尔士语 | cy |
班图语 | xh |
意第绪语 | yi |
约鲁巴语 | yo |
祖鲁语 | zu |
如有需要的可自行下载测试
注意:软件运行路径中不能有中文和空格
语音识别转文字软件faster-whisper整合包下载链接:
相关推荐
麦克风电脑内播放声音实时识别转文字软件FunASR整合包V5下载
离线语音识别转文字软件Faster-whisper整合包使用说明视频教程
音频视频转文字软件faster-whisper 1.2.0整合包下载,精准快速语音转录工具
实时语音识别转文字软件V3版,批量音频视频录音转文字提取工具下载
免费音频视频语音识别转文字软件SenseVoice整合包,支持批量操作可生成字幕
照片人物表情控制软件AdvancedLivePortrait整合包,图片转视频工具
最新版PDF转Markdown格式软件MinerU一键启动整合包v0.10.0下载
AI视频修复软件Topaz Video AI v5.5.0绿色版,模糊视频变清晰工具
最近更新

pixi包管理器简易教程系列:pypi方法安装pytorch
pytorch可以从conda-forge安装,也可以从Pypi安装,看到目前官方页面上安装命令里已经不提供conda的安装命令了,只有pip命令,所以这里用pypi方式安装。 打开项目文件夹内的pixi.toml文件,添加下面命令要求 执...

pixi包管理器简易教程系列:入门之创建项目及激活虚拟环境
pixi是新一代包管理和环境管理工具,安装python依赖包非常快,用了几次感觉还不错,记录一下个人学习使用pixi的一些经验。 Linux系统安装pixi方法 或是 wget -qO- https://pixi.sh/install.sh...

comfyui视频人物换主体工作流及模型下载
本次分享一个好玩的视频人物换主体工作流,本工作流可以使用一张图片中的主体替换视频中的人物主体。比如抖音上很多热门的猴子炒饭,奥特曼炒饭,猴子vlog等等,都可以使用人物主体替换把原来视频中的人物替换成指定的人物。 comfyui工作流节点使...

github.com镜像加速网站,解决无法访问下载速度慢的问题
github.com是全球最大的开源社区,上面有着大量的优秀的开源应用。特别是当前AI极速发展,各种AI应用层出不穷,极大的方便了我们生活办公。但是由于网络原因,有时候github.com从国内可能无法访问,要么就访问速度极慢,不能方便快捷...

comfyui工作流软件官方原版windows版一键启动整合包下载
comfyui是目前非常热门的一个应用,它使python应用可以图形化以节点的方式直接拖拽使用,使用起来非常方便,而且可以与其他python应用节点配合使用,大大丰富了comfyui的功能,而且网上大量平台可以下载到各种的comfyui工作...

视频人物动作迁移wan2.1 VACE comfyUI工作流及模型下载,一键人物动作复刻
本次分享一个非常好玩的视频人物动作迁移comfyui工作流,可以通过文生视频或图片转视频将视频素材中的人物动作复制到新生成的视频人物中,视频生成模型主要使用了wan2.1 VACE模型。 comfyui工作流节点使用说明 首先打开网盘链接将...

凡人修仙传动画韩立高清图片壁纸素材AI绘画图集
恭迎韩天尊! 祝贺韩天尊顺利结婴! 热门国漫凡人修仙传动画已经更新了5年了,最新一集,主人公韩立顺利结婴,成为一名元婴修士。我属于是比较喜欢看动漫的,看过的动漫估计没过百也得大几十了,热门国漫大多都看过。凡人修仙传算是最喜欢的动漫之一,韩立...

凡人修仙传动画紫灵高清图片壁纸素材AI绘画图集,AI国漫女神系列
凡人修仙传动画乱星海第一美女紫灵是大家非常喜欢的一个角色,动画人物造型精美,是众多女性角色中最受欢迎之一,热度极高。很多人喜欢收集紫灵的图片,但是视频里截图的话可能截不到喜欢的图,下面分享一些紫灵的AI绘画图片素材,图片都是SD生成的,都是...

凡人修仙传动画宋玉高清图片壁纸素材AI绘画图集,AI国漫女神系列
凡人修仙传动画里宋玉是大家比较喜欢的一个角色,动画人物造型精美,当前热度极高。虽然凡人修仙传原著里只是韩老魔的弟子,但是很多短视频创作者非常能整活,已经把宋玉纳入韩老魔后宫了。很多人喜欢收集宋玉的图片,但是视频里截图的话可能截不到喜欢的图,...

凡人修仙传动画人物梅凝高清壁纸素材AI绘画图片,AI国漫女神系列
有些人比较喜欢凡人修仙传动画里梅凝这个角色,视频里截图的话可能截不到喜欢的图,下面分享一些梅凝的AI绘画图片素材,图片都是SD生成的,都是高清大图,非凡人修仙传动画视频截图。部分梅凝图片如下: 图片及模型文件下载链接: https://pa...