AI软件下载
有趣网站推荐及实用软件下载

无限长度的数字人对话视频生成软件InfiniteTalk整合包​​,图像转视频、视频配音对口型工具

InfiniteTalk是一款发布不久的数字人视频制作软件,软件可以通过音频驱动将一张图片合成为一段视频,或是将视频与音频整合成一段新视频,实现音频唇形同步,是一个非常强大的对口型工具。

InfiniteTalk官方介绍

我们提出了一种新颖的稀疏帧视频配音框架——InfiniteTalk。给定一个输入视频和音频轨道,InfiniteTalk 可以合成一个具有精确唇部同步的新视频,同时将头部动作、身体姿势和面部表情与音频同步。与传统的仅关注唇部的配音方法不同,InfiniteTalk 能够生成无限长的视频,并实现精确的唇部同步和一致的身份保留。此外,InfiniteTalk 还可以用作图像-音频-视频模型,以图像和音频作为输入。

  • 💬 ​​稀疏帧视频配音​​ – 不仅同步嘴唇,还同步头部、身体和表情
  • ⏱️​​无限长度生成​​ – 支持无限视频时长
  • ✨ ​​稳定性​​ – 与 MultiTalk 相比,减少了手部/身体的扭曲
  • 🚀 ​​唇语准确度​​ – 实现优于 MultiTalk 的唇语同步

在线云镜像使用说明

InfiniteTalk 模型文件大约超230G,运行使用内存超90G,InfiniteTalk 非常大且对电脑配置要求极高,我制作了个云镜像,可以云端一键启动。

GPU配置选择:

生成480P视频选择24G RTX40系, 94G内存

生成720P视频选择24G RTX40系

软件使用说明

首先根据不同需求,上传图片素材或视频素材,素材尺寸建议使用720P的

上传驱动音频,也就是要让人物说话的内容

描述词:想要生成视频内容的文本描述词

音频类型:para: 并行, add: 叠加

分辨率支持480P和720P视频生成

设置选项建议先保持默认

在进行两人对话合成时,两人的音频时长需要一致,一个人说话时,另一个人的音轨可以设为静音,如下图所示。

视频教程及效果演示:https://nuowa.net/2251

注意事项

生成视频时长建议在1分钟以内

生成480P可选择94G内存24G显存配置

生成720P视频需选择48G显存配置

InfiniteTalk云端在线一键启动链接

使用云镜像>>


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(2) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

FunASR语音识别转文字软件区分说话人版-诺瓦小站

FunASR语音识别转文字软件区分说话人版

FunASR是一款优秀的基础语音识别框架,配合阿里通义团队开发的其它语音识别模型,能够实现非常好语音转文字效果,尤其在中文语音识别方面,鉴于有些用户需要对语音识别内容区分说话人,我重新做了一版区分说话人的版本。软件支持多语言识别,但是还是尽...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫