分享价值
提升价值

免费语音识别转文字软件faster-whisper整合包下载,音频视频文字提取工具

faster-whisper是基于OpenAI的whisper的优化版本,faster-whisper使用CTranslate2对 OpenAI 的 Whisper 模型的重新实现,它是 Transformer 模型的快速推理引擎。在相同准确率下,该实现比openai/whisper快 4 倍,同时占用更少的内存。在 CPU 和 GPU 上均采用 8 位量化,效率可进一步提高。

以下是使用不同实现方式转录13 分钟音频所需的时间和内存使用测试结果,测试设备为NVIDIA Tesla V100S,模型为Large-v2:

测试工具精确Beam size时间最大GPU显存最大CPU内存
openai/whisperfp1654m30s11325MB9439MB
faster-whisperfp16554s4755MB3244MB
faster-whisperint8559s3091MB3117MB

可以明显的看出faster-whisper的执行速度是有非常大的提升的,快了近5倍了。这个应用是非常好的一个工具了,我制作了最新版的faster-whisper一键启动整合包,操作界面如下:

免费语音识别转文字软件faster-whisper整合包下载,音频视频文字提取工具

软件支持音频文件和视频文件的语音转文字

默认使用模型为small,模型越大识别效果越好,但是对电脑配置要求也越高,如果想使用更大的模型,需要到网盘里将另外两个模型下载到项目文件夹里huggingface文件夹内,

软件支持将识别的内容翻译为其它语言,可选的翻译工具有百度翻译和谷歌翻译,国内用户可用百度翻译,国外用户可用谷歌翻译。使用百度翻译需要先申请APP ID和密钥,可以看这篇文章《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》,将申请到的APP ID和密钥填到软件里即可使用百度翻译功能。

如使用翻译功能必须填写下面的目标语言,软件里我只预设了少量几种语言,但是百度和谷歌支持几十种语言的翻译,你可以将语言代码直接填到目标语言输入框里。百度和谷歌翻译的语言代码如下:

百度翻译语言代码列表

语言代码名称
zh中文
en英语
yue粤语
wyw文言文
jp日语
kor韩语
fra法语
spa西班牙语
th泰语
ara阿拉伯语
ru俄语
pt葡萄牙语
de德语
it意大利语
el希腊语
nl荷兰语
pl波兰语
bul保加利亚语
est爱沙尼亚语
dan丹麦语
fin芬兰语
cs捷克语
rom罗马尼亚语
slo斯洛文尼亚语
swe瑞典语
hu匈牙利语
cht繁体中文
vie越南语

Google翻译语言代码列表

语言代码
南非荷兰语af
阿尔巴尼亚语sq
阿姆哈拉语am
阿拉伯语ar
亚美尼亚文hy
阿萨姆语as
艾马拉语ay
阿塞拜疆语az
班巴拉语bm
巴斯克语eu
白俄罗斯语be
孟加拉文bn
博杰普尔语bho
波斯尼亚语bs
保加利亚语bg
加泰罗尼亚语ca
宿务语ceb
中文(简体)zh-CN
中文(繁体)zh-TW
科西嘉语co
克罗地亚语hr
捷克语cs
丹麦语da
迪维希语dv
多格来语doi
荷兰语nl
英语en
世界语eo
爱沙尼亚语et
Eweee
菲律宾语(塔加拉语)fil
芬兰语fi
法语fr
弗里斯兰语fy
加利西亚语gl
格鲁吉亚语ka
德语de
希腊文el
瓜拉尼人gn
古吉拉特文gu
海地克里奥尔语ht
Hausaha
夏威夷语haw
希伯来语he 或 iw
印地语hi
苗语hmn
匈牙利语hu
冰岛语is
伊博语ig
伊洛卡诺语ilo
印度尼西亚语id
爱尔兰语ga
意大利语it
日语ja
爪哇语jv 或 jw
卡纳达文kn
哈萨克语kk
高棉语km
卢旺达语rw
Konkanigom
韩语ko
Kriokri
库尔德语ku
库尔德语(索拉尼)ckb
吉尔吉斯语ky
老挝语lo
拉丁文la
拉脱维亚语lv
林加拉语ln
立陶宛语lt
卢干达语lg
卢森堡语lb
马其顿语mk
迈蒂利语mai
马尔加什语mg
马来语ms
马拉雅拉姆文ml
马耳他语mt
毛利语mi
马拉地语mr
梅泰语(曼尼普尔语)mni-Mtei
米佐语lus
蒙古文mn
缅甸语my
尼泊尔语ne
挪威语no
尼杨扎语(齐切瓦语)ny
奥里亚语(奥里亚)or
奥罗莫语om
普什图语ps
波斯语fa
波兰语pl
葡萄牙语(葡萄牙、巴西)pt
旁遮普语pa
克丘亚语qu
罗马尼亚语ro
俄语ru
萨摩亚语sm
梵语sa
苏格兰盖尔语gd
塞佩蒂语nso
塞尔维亚语sr
塞索托语st
修纳语sn
信德语sd
僧伽罗语si
斯洛伐克语sk
斯洛文尼亚语sl
索马里语so
西班牙语es
巽他语su
斯瓦希里语sw
瑞典语sv
塔加路语(菲律宾语)tl
塔吉克语tg
泰米尔语ta
鞑靼语tt
泰卢固语te
泰语th
提格里尼亚语ti
Tsongats
土耳其语tr
土库曼语tk
契维语(阿坎语)ak
乌克兰语uk
乌尔都语ur
维吾尔语ug
乌兹别克语uz
越南语vi
威尔士语cy
班图语xh
意第绪语yi
约鲁巴语yo
祖鲁语zu

如有需要的可自行下载测试

免费语音识别转文字软件faster-whisper整合包下载链接:

1V1答疑支持
爱发电:点击前往
赞(3) 打赏
文章名称:《免费语音识别转文字软件faster-whisper整合包下载,音频视频文字提取工具》
文章链接:https://nuowa.net/667
本站原创文章未经允许不得转载,分享资源仅供个人学习研究,不可用于违法违规用途,否则法律问题自行承担。

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫