
免费音频视频语音识别转文字软件SenseVoice整合包,支持批量操作可生成字幕
本次分享的是阿里团队退出的一款快速免费语音识别转文字软件SenseVoice,以前分享过paraformer-zh-streaming模型的实时识别版,本次的是SenseVoiceSmall模型非实时识别版,本人二次开发优化版,可识别音频视...

本次分享的是阿里团队退出的一款快速免费语音识别转文字软件SenseVoice,以前分享过paraformer-zh-streaming模型的实时识别版,本次的是SenseVoiceSmall模型非实时识别版,本人二次开发优化版,可识别音频视...

faster-whisper是基于OpenAI的whisper的优化版本,faster-whisper使用CTranslate2对 OpenAI 的 Whisper 模型的重新实现,它是 Transformer 模型的快速推理引擎。在相同准...

CosyVoice是阿里团队推出的一款强大的TTS文字转语音工具,支持3秒声音复刻,跨语种复刻,情感语音合成等功能,支持几十种语言,合成速度快,发音流畅自然,非常的强大。本软件为免费开源软件,原项目地址:https://github.com...

Marker是另一款比较热门的PDF格式文件转Markdown文件的软件,之前介绍过一个软件MinerU:《PDF转md格式软件MinerU整合包下载,一键pdf批量转markdown免费工具》,Marker相对来说操作更简单一些,也比较受...
FlashVSR低分辨率模糊视频高清放大工具整合包v1.1下载,免安装一键启动2025-11-18
多图编辑人物一致性图片合成处理工具Qwen-Image-Edit-2509整合包下载,人物换装换姿势动作软件2025-11-08
VibeVoice:富有表现力的长篇多人对话语音合成工具整合包下载2025-11-14
FunASR最新模型FunAudioLLM/Fun-ASR-Nano-2512实时语音识别转文字热词版整合包下载2025-12-21
Crawl4AI:基于AI大语言模型的网络爬虫和数据抓取工具整合包软件下载2025-11-29