AI软件下载
有趣网站推荐及实用软件下载

LTX2.3+comfyui音频驱动视频生成工作流

这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低生成速度更快。


主要功能

音频驱动视频生成 上传音频文件后,工作流会自动根据音频时长计算视频帧数,生成内容与音频节奏、时长完全匹配的视频,无需手动设定秒数。

人声分离 内置 MelBandRoFormer 模型,可自动将音频中的人声与背景音乐分离,默认使用分离后的人声驱动视频生成,背景音乐也会保留在最终输出中,也可以通过开关切换使用原始音频。

分段提示词控制 通过 PromptRelayEncodeTimeline 节点,可以在时间轴上为不同片段设置不同的提示词,实现镜头切换、场景变化等效果。

性能优化 集成了 SageAttention 加速和 LTXVChunkFeedForward 分块前馈,在保证画质的同时降低显存占用,大幅提升生成速度。


使用步骤

  1. 在音频输入节点上传 .wav 格式音频文件,设置截取区间(start/end time)
  2. 在图片输入节点上传与音频对应的参考人物图片
  3. 根据需要调整视频分辨率(宽 × 高),默认为竖屏 640 × 1120
  4. 在 Prompt Relay 节点填写全局提示词及分段描述
  5. 运行工作流,结果以 MP4 格式保存输出

分辨率参考

方向可选尺寸
横版848×480 / 960×544 / 1120×640
竖版480×848 / 544×960 / 640×1120
方形512×512 / 768×768

注意事项

  • 音频格式:建议使用 WAV 格式,视频时长由音频时长自动决定
  • 参考图片:图片中人物面部尽量清晰,角度正面效果更佳
  • 显存需求:建议英伟达显卡30系列起,显存 8GB 以上

ltx2.3音频驱动视频生成工作流及模型下载

https://pan.quark.cn/s/186b6dd01260

本工作流文件名为“LTX2.3漫剧视频制作音频参考版.json”


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(0) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

LTX2.3+comfyui音频驱动视频生成工作流

这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...

windows电脑C盘垃圾查找清理软件

电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...

Mineru PDF转markdown软件局域网版

对于有的电脑配置比较低或是win7系统等电脑无法使用Mineru情况,可以使用局域网内可运行软件的电脑运行Mineru,然后其它电脑或手机等终端输入IP地址,打开运行软件的IP地址来使用Mineru。 具体用法: 下载局域网版压缩包到本地电...

Studio One Pro 7免费开心版下载-诺瓦小站

Studio One Pro 7免费开心版下载

Studio One 7是一款专业数字音频工作站(DAW)软件,它是音乐制作、混音、母带处理与现场演出一体化的旗舰软件。 ✨ 核心功能 1. AI 智能音轨分离(Stem Separation) AI 驱动的音轨分离功能允许用户将混缩后的音...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫