本工具是一款面向 AI 视频生成创作者的本地离线辅助软件。用户导入任意视频文件,工具会自动完成场景检测、关键帧提取、多模态模型分析、提示词拼装等全流程,最终输出一份可直接复制粘贴到即梦 AI 等视频生成平台的完整提示词。
核心理念:把”看视频写提示词”的体力活交给 AI,让创作者专注于创意本身。
适用场景
- 看到喜欢的视频风格/运镜,想反推出可复用的提示词
- 需要将自己的成品视频转为提示词,用于二次迭代创作
- 批量分析视频素材库,建立个人提示词资产库
功能特点
1. ⚡ 全流程一键自动化
从上传视频到输出提示词,中间无需人工干预:
上传视频 → 场景检测 → 关键帧提取 → AI逐帧分析 → 综合汇总 → 生成提示词
2. 🧠 三层混合智能抽帧策略
采用先进的帧提取算法,确保捕捉到视频中的每一个关键瞬间:
| 层级 | 方法 | 作用 |
|---|---|---|
| 第1层 | PySceneDetect 场景切换检测 | 精准定位镜头切换点,每个切换点前后各取1帧 |
| 第2层 | Farneback 稠密光流法 | 每0.1秒采样,自动计算自适应运动阈值,捕捉爆炸/打击/特效等高动态瞬间 |
| 第3层 | pHash 感知哈希去重 | 相似度 > 90% 的帧自动去重,避免重复分析 |
自适应帧数上限,按运动强度排序保留:
| 视频时长 | 最大帧数 | 说明 |
|---|---|---|
| < 20秒 | 60帧 | 短片段精细覆盖 |
| 20~60秒 | 120帧 | 中等长度全面覆盖 |
| > 60秒 | 不限 | 长视频完整保留,不遗漏 |
3. 🏗️ 结构化专业分析维度
每帧从 8 个维度深度解析,涵盖即梦 AI 提示词所需全部要素:
- 【主体】 画面中的主要人物或物体
- 【动作】 主体正在进行的动作或运动状态
- 【环境】 场景背景、地点、时间(白天/夜晚)
- 【镜头】 镜头类型(特写/中景/全景/俯视/仰视/跟踪/慢动作等)
- 【风格】 画面整体风格(写实/赛博朋克/古风/玄幻/电影感等)
- 【光效】 光线类型(丁达尔光/霓虹灯/火焰光/冷月光/爆炸光等)
- 【色调】 整体色彩倾向(冷色调/暖色调/高对比/低饱和等)
- 【特效】 画面中出现的特效元素(粒子/能量/烟雾/爆炸/魔法等)
4. 📋 即梦 AI 一键复制输出
最终提示词采用标准格式,可直接粘贴到即梦等平台使用:
[整体设定](涵盖风格/主体/环境/光影等)
[镜头 | 时间段]
主体:xxx
动作:xxx
环境:xxx
镜头:xxx
风格:xxx
光效:xxx
色调:xxx
特效:xxx
5. 🚀 本地部署,数据安全
- 所有计算在本地完成,视频和画面不上传云端
- 基于 vLLM + Qwen3.5本地推理
- 支持 4B / 9B / 2B / 0.8B 四种模型规格,按需选择
6. 🔧 模型自动下载
- 通过 ModelScope 自动下载所选模型(首次使用需等待下载完成)
- 下载后缓存到本地,后续使用无需重复下载
7. 🖥️ 直观的 Gradio 图形界面
- 视频上传 + 模型选择 + 一键分析
- 关键帧画廊预览
- 各镜头分析结果
- 完整提示词输出(带一键复制按钮)
- 处理进度条实时反馈
快速开始
第1步:启动 vLLM 推理服务
双击 0启动vllm.bat,等待终端显示 vLLM 服务启动完成。
- 首次启动会自动通过 ModelScope 下载所选模型,请保持网络通畅
- 看到
Uvicorn running on http://127.0.0.1:8000即为启动成功 - 默认使用 bfloat16 精度(自动检测 GPU 兼容性,不支持的显卡自动回退 float16)
第2步:打开 Gradio 操作界面
双击 1启动UI.bat,稍等片刻浏览器将自动打开操作界面。
- 如未自动打开,手动访问
http://127.0.0.1:7860 - 界面标题:本地视频提示词反推工具
第3步:开始分析
- 上传视频 — 点击视频上传区域选择视频文件
- 选择模型 — 在下拉框中选择 Qwen3.5 模型规格
- 点击”🚀 开始分析” — 等待进度条走完
- 查看结果 — 左侧画廊展示提取的关键帧,右侧展示分析结果和完整提示词
- 复制提示词 — 点击完整提示词框的复制按钮,粘贴到即梦 AI 使用
模型说明
本工具默认使用 Qwen/Qwen3.5-4B,可选规格:
| 模型 | 显存需求 | 速度 | 分析质量 | 推荐场景 |
|---|---|---|---|---|
| Qwen3.5-0.8B | 2GB+ | ⚡⚡⚡⚡⚡ | ★★ | 快速预览、低配显卡 |
| Qwen3.5-2B | 4GB+ | ⚡⚡⚡⚡ | ★★★ | 一般分析需求 |
| Qwen3.5-4B | 8GB+ | ⚡⚡⚡ | ★★★★ | 默认推荐,平衡速度和效果 |
| Qwen3.5-9B | 16GB+ | ⚡⚡ | ★★★★★ | 追求最高分析精度 |
模型通过 config.json 持久化记录,每次启动自动加载上次选中的模型。
注意事项
⚠️ 使用须知
- 顺序要求:必须先启动
0启动vllm.bat,再启动1启动UI.bat,不可颠倒 - vLLM 启动等待:首次启动 vLLM 需要加载模型到 GPU,可能需要 1~5 分钟,
- 模型下载:首次使用新模型时,会自动通过 ModelScope 下载,下载速度取决于网络状况
- 显存占用:4B 模型约占用 8GB+ 显存,9B 模型约占用 16GB+ 显存,请确保显卡有足够余量
- 浏览器保持:使用过程中不要关闭浏览器标签页,否则进度会中断
- vLLM 端口冲突:如果 8000 端口被占用,请关闭占用程序后再启动
- 显卡温度:长时间连续分析大量视频时,请注意监控显卡温度
- 视频格式:支持主流视频格式(MP4、AVI、MOV、MKV 等),推荐使用 MP4 格式
AI视频提示词反推软件下载链接
https://pan.quark.cn/s/84f19aa7668b
相关推荐
BiliNote:自动生成B站油管视频笔记,AI视频内容总结工具
闲鱼自动回复机器人XianyuAutoAgent下载,24小时在线智能客服机器人系统
腾讯混元三维世界重建系统WorldMirror 2.0通用3D三维资产重建工具下载
PDF转word软件FreeP2W免安装版下载
图片/PDF转HTML/Markdown/JSON软件Chandra—— Windows 版一键启动包,免安装部署,可离线
openclaw AI助手windows电脑安装部署及微信聊天配置详细教程
Apple苹果3D 高斯(3DGS)模型ply文件生成器,图片转3D模型软件下载
字节跳动Dolphin图片文档解析工具免安装一键启动整合包下载,PDF转JSON/Markdown软件
最近更新

最强分说话人语音识别工具,支持批量音视频识别转字幕,字幕翻译内容总结
本软件是一款基于 Qwen3-ASR-1.7B 大模型的本地音视频语音识别工具,配备说话人分离功能,可在个人电脑上实现: 整个流程通过简洁的 Gradio Web 界面 操作,点击按钮即可完成识别与导出。 主要功能特点 1. 单文件识别与批...

最强PR中文视频自动语音识别生成字幕插件,语音识别准确率高支持多国语言
上次和大家分享了PR非常好用的自动剪辑口播视频静音片段插件,如果想要自动生成视频字幕的话,用PR自带的语音识别转字幕工具,效果非常差,语音识别准确率非常低,识别的文本差太多手动修改起来极其麻烦,反而更加浪费时间了。为了提高工作效率,降低人工...

祝贺凡人修仙传2026年新年番开播同时在线人数超64万
今天6月13日凡人修仙传新年番开播,同时在线人数破64万(非最高在线人数,只是我看到的在线人数),作为凡人5年老粉,必须发个帖祝贺一下。 我比较喜欢看动漫,各种类型看了很多,具体不清楚多少,像斗罗斗破之类看了一大半终究是没能看下去,还是雾山...

Premiere Pro静音片段自动剪辑插件——Silence Remover使用教程及下载
对于做口播、Vlog、播客剪辑的朋友来说,最耗时的工作之一就是手动找出视频中的”哑巴”片段——说话间隙、停顿、思考时的”嗯啊”——并逐一删除。今天给大家介绍一款来自 Phantom Edito...

蛙蛙写作-能替你"打工"的AI写作平台,附邀请码:UZekHC
我不是一个容易被工具说服的人。用过 ChatGPT、试过各种”AI写作神器”,大多数要么写出来全是机翻腔,要么根本不懂网文的爆款逻辑。 直到我开始用蛙蛙写作,才发现原来一个工具真的可以懂你想写什么。 🐸 蛙蛙写作是什...

PDFMathTranslate + MinerU 批量PDF全文双语翻译转Markdown工具
本工具是一款基于 PDFMathTranslate 与 MinerU 整合的桌面端 PDF 翻译工具,通过简洁的 Web 界面实现一键式 PDF 全文双语翻译,并可选择将翻译结果导出为 Markdown 格式,方便导入知识库或进行二次编辑。...

Claude居然自称“本人”
今天在和Claude聊网文写作的时候,Claude回复中居然自称本人,这让我有点震惊。 我经常会和AI聊工具功能对比等话题,ChatGPT、Gemini、Claude这些以前我记得从来没有自称过本人的,好像都是本模型,本工具等等,反正从来没...

图像无损放大神器:Topaz Gigapixel AI软件下载及使用指南
在数字内容创作成风头的今天,我们经常会遇到低分辨率素材模糊、AI 生成图片尺寸太小、或者老照片充满噪点的情况。传统的图像放大方式(如双三次插值)只是单纯地拉伸像素,容易让画面变得模糊、虚化。 如果你正在寻找一种能“凭空”补齐细节、让低画质瞬...

AI视频提示词反推工具,参考视频即梦提示词一键生成
本工具是一款面向 AI 视频生成创作者的本地离线辅助软件。用户导入任意视频文件,工具会自动完成场景检测、关键帧提取、多模态模型分析、提示词拼装等全流程,最终输出一份可直接复制粘贴到即梦 AI 等视频生成平台的完整提示词。 适用场景 功能特点...
免费在线HTML转markdown工具
经常看一些在线文档,想复制给AI参考的话不方便直接复制,转换成markdown再给AI阅读会更简单明了,也方便自己查阅,这里给大家推荐两个在线的免费HTML转markdown网站。 1、https://d1tools.com/tools/c...














