 

AI音频

AI语音生成及音频处理相关工具

极速轻便声音克隆语音合成软件MOSS-TTS-Nano整合包，CPU可流畅运行

一、项目概述 MOSS-TTS-Nano 是由 MOSI.AI 与 OpenMOSS 团队联合开发的开源多语言小模型语音合成系统。模型参数量仅 0.1B，专为实时语音生成场景设计，无需 GPU 即可在 CPU 上直接运行，适合本地演示、W...

赞(0)2026-06-27

本软件是一款基于 Qwen3-ASR-1.7B 大模型的本地音视频语音识别工具，配备说话人分离功能，可在个人电脑上实现：整个流程通过简洁的 Gradio Web 界面操作，点击按钮即可完成识别与导出。主要功能特点 1. 单文件识别与批...

赞(1)2026-06-21

AI 实时语音对话系统是一款集语音识别（ASR）、大语言模型（LLM）对话、语音合成（TTS）于一体的实时语音交互软件。用户通过麦克风说话，系统自动识别语音内容并转为文字，交由 AI 角色进行智能回复，最终将回复内容合成为语音实时播放，实...

赞(1)2026-05-28

Chatterbox 是由 Resemble AI 开发的开源文本转语音（Text-to-Speech, TTS）模型，支持零样本音色克隆：只需提供一段参考音频（几秒钟的人声），即可模仿该音色朗读任意文本。我基于最新版源码制作了免安装一键启...

赞(0)2026-05-19