AI软件下载
有趣网站推荐及实用软件下载

cosyvoice gradio页面生成的音频无法下载

在调试cosyvoice应用的时候,发现官方默认的webui界面生成的音频无法下载,即使等很久下载下来的也是0KB空文件,可以通过修改如下代码解决这个问题

以3秒克隆为例,for i in cosyvoice.inference_zero_shot(tts_text, prompt_text, prompt_speech_16k, stream=stream, speed=speed):功能部分做如下修改:

outaudio = None  
        
        set_all_random_seed(seed)
        for i in cosyvoice.inference_zero_shot(tts_text, prompt_text, prompt_speech_16k, stream=stream, speed=speed):
            audio = i['tts_speech'].numpy().flatten()
            if outaudio is None:
                outaudio = audio
            else:
                outaudio = np.concatenate([outaudio, audio])                     
            yield (cosyvoice.sample_rate, outaudio)

并且合成音频按钮删除自动播放autoplay和流媒体streaming

audio_output = gr.Audio(label="合成音频")

重新启动应用,点击音频下载按钮就可以下载有效的音频文件了。


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(0) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

FunASR语音识别转文字软件区分说话人版-诺瓦小站

FunASR语音识别转文字软件区分说话人版

FunASR是一款优秀的基础语音识别框架,配合阿里通义团队开发的其它语音识别模型,能够实现非常好语音转文字效果,尤其在中文语音识别方面,鉴于有些用户需要对语音识别内容区分说话人,我重新做了一版区分说话人的版本。软件支持多语言识别,但是还是尽...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫