WorldMirror 2.0 是由腾讯混元(Hunyuan)团队开发的下一代通用三维世界重建系统,底层基于 HY-World-2.0 模型。它能够从一组普通照片或一段视频中,自动恢复出场景的三维结构,并生成多种形式的三维资产,包括:
- 点云 / 网格(Mesh)模型:场景的几何结构重建
- 3D 高斯泼溅(Gaussian Splatting):高质量的神经渲染表示
- 深度图 / 法线图:每帧对应的几何信息
- 相机参数:每张图像的位姿与内参
我基于当前最新版源码制作了免安装一键启动整合包,功能略作优化,修复已知BUG,UI界面翻译调整

软件特点
1. 多视角三维重建
只需提供围绕场景拍摄的多张照片(或一段视频),即可自动完成相机姿态估计、深度估计、法线估计,并融合为完整的三维场景。
2. 支持多种输出形式
- GLB 格式的三维网格/点云模型:可直接在浏览器中交互查看,也支持导入 Blender、Unity 等软件
- 3D 高斯泼溅(3DGS):新一代神经渲染技术,渲染质量高、速度快,适合高质量可视化展示
- 每帧深度图与法线图:可用于后续的二次编辑或分析
- 相机参数导出:支持 COLMAP 格式的相机位姿与内参,方便对接传统三维重建管线
3. 支持视频输入
内置视频抽帧工具,自动从视频中按指定间隔提取关键帧,无需手动预处理。
4. 天空背景检测与过滤
集成了天空检测模型,可自动识别并滤除天空区域,避免天空干扰三维重建质量;天空过滤开关可在界面中实时切换。
5. 高斯泼溅体素合并优化
使用体素合并算法对高斯点云进行压缩,在保证质量的前提下显著减少高斯数量,降低文件体积和渲染开销。
6. 边缘与低置信度过滤
自动检测场景中的边缘区域和低置信度预测,用户可通过开关控制是否滤除这些区域以获得更干净的模型。
WorldMirror 2.0应用界面功能详解
应用界面分为:左栏(文件上传与终端)、右栏(三维可视化与重建控制)
左栏:文件上传
| 组件 | 功能说明 |
|---|---|
| 上传视频或图片 | 支持上传多张图片(PNG/JPG/JPEG/WebP/HEIC)或视频文件(MP4/AVI/MOV/MKV 等)。支持批量上传。 |
| 视频采样间隔(秒) | 当上传视频时,此滑块控制每隔多少秒抽取一帧。值越大,抽帧越少;建议对运动缓慢的场景用 1.0-2.0 秒,快速运动的场景用 0.5-1.0 秒。 |
| 重新采样 | 仅对视频有效。调整采样间隔后点击此按钮,按新的间隔重新抽取视频帧。 |
| 图片预览 | 显示已上传/抽取的所有图片,方便确认输入数据。 |
| 终端输出 | 显示运行过程中的实时日志(模型加载、推理进度、保存状态等),便于排查问题。 |
右栏:三维可视化与重建控制
顶部状态栏
- 显示当前操作状态提示(如”请上传文件,然后点击开始重建”、”正在重建中…”、”重建成功”等)。
查看标签页
| 标签页 | 功能说明 |
|---|---|
| 3D 高斯泼溅 | 以高斯泼溅形式展示三维场景。支持鼠标拖拽旋转、滚轮缩放,交互流畅。这是最高质量的渲染效果。 |
| 点云 / 网格 | 以三角网格或点云形式展示场景的几何结构。同样支持鼠标交互查看。可通过下方的重建选项切换显示模式。 |
| 深度图 | 逐帧查看每张输入图像对应的深度估计结果。拖动滑块切换不同帧,深度值以伪彩色显示(暖色近、冷色远)。 |
| 法线图 | 逐帧查看每张图像对应的法线估计结果。RGB 颜色编码了表面的朝向信息。 |
| 相机参数 | 可下载所有输入图像对应的相机位姿和相机内参 JSON 文件,格式兼容 COLMAP。 |
重建按钮
- 开始重建:点击后启动世界重建流程。处理时间取决于图片数量和分辨率,通常从数十秒到数分钟不等。
- 清除:一键清除所有上传文件和重建结果,重置界面。
帧选择器
- 显示指定帧的点云:默认为”All”(显示所有帧),可切换为特定帧,仅显示该帧视角下的点云数据。
重建选项(不适用于 3DGS)
| 选项 | 说明 |
|---|---|
| 显示相机 | 在 3D 场景中显示相机图标/位置,便于理解每张照片的拍摄视角。 |
| 显示网格 | 切换点云/网格标签页的显示方式为三角网格(勾选)或原始点云(取消勾选)。 |
| 过滤低置信度 & 边缘 | 自动检测并滤除重建质量较低的区域和深度不连续边缘。开启后模型更干净但可能丢失部分细节。 |
| 过滤天空背景 | 开启后自动识别并移除天空区域。对于室外场景建议开启,室内场景可关闭。 |
注意:以上选项修改后会自动刷新 3D 场景,无需重新运行推理。
注意事项
1. 输入图片要求
- 数量:图片越多,重建质量越好,生成耗时越久。
- 覆盖:拍摄时应围绕场景从不同角度拍摄,确保每部分至少有 2-3 张图片覆盖。
- 重叠:相邻图片之间应有 60% 以上的视野重叠。
- 清晰度:避免运动模糊或过暗的图片。
- 格式:支持 PNG、JPG、JPEG、WebP、HEIC/HEIF。
2. 视频输入建议
- 拍摄时保持匀速移动,避免剧烈抖动。
- 采样间隔建议:慢速环绕拍摄用 1.0-2.0 秒,手持步行拍摄用 0.5-1.0 秒。
- 视频总帧数建议控制在 50-200 帧之间。
3. 硬件要求
- GPU:建议 NVIDIA 显卡30系列起,显存 6GB 以上,显存越大性能越好
- 系统:windows 10 或 11
4. 运行时间
- 推理时间与图片数量、分辨率成正比。
- 体素合并和高斯点云优化在后处理阶段进行,通常耗时数秒。
5. 输出文件说明
重建完成后,在 output/ 目录下会生成以时间戳命名的文件夹,包含:
| 文件 | 说明 |
|---|---|
scene_xxx.glb | 三维场景模型文件(点云/网格),可在浏览器或 Blender 中打开 |
gaussians.ply | 高斯泼溅点云文件,可用 3DGS 查看器渲染 |
camera_params.json | 相机参数(位姿 + 内参),COLMAP 兼容格式 |
predictions.npz | 完整的推理结果(深度、法线、掩码等),可用于二次分析 |
images/ | 输入图片目录 |
depth/、normals/ | 每帧对应的深度图、法线图 PNG 文件 |
sky_mask/ | 天空区域掩码 PNG 文件 |
6. 已知限制
- 对纯色的、缺乏纹理的场景(如白墙、光滑地面)重建效果可能不佳。
- 透明/反射物体(玻璃、水面)可能产生不准确的深度估计。
- 输入图片尺寸过大会显著增加显存消耗,系统会自动缩放到合适的尺寸(最大 952px)。
- 高度动态的场景(人群中、车流中)可能导致重建失败。
腾讯混元WorldMirror 2.0整合包下载链接
https://pan.quark.cn/s/78597f48e361
相关推荐
Apple苹果3D 高斯(3DGS)模型ply文件生成器,图片转3D模型软件下载
微软最新图片转3D网格模型软件TRELLIS.2 windows版整合包下载,AI一键建模工具
高精度2D图片转3D网格模型软件Stable3DGen整合包下载
腾讯混元3D大模型2.1版图片文本转3D网格模型软件Hunyuan3D-2.1整合包
图片转3D模型软件Wonder3D整合包使用说明视频教程
微软2D图片/文本转3D模型软件TRELLIS整合包使用说明视频教程
微软图片转3D模型软件TRELLIS整合包下载,2D图片转3D GLB资产
图片转3D模型软件Wonder3D++整合包下载,AI一键生成3D网格建模工具
最近更新
阿里千问Qwen3-TTS声音克隆语音合成软件【低配电脑版】
阿里千问Qwen3-TTS是一款热门的语音合成及声音克隆软件,我基于当前最新版制作了免安装一键启动整合包,并增加多人对话语音合成功能。 此版本为低配显卡电脑版,软件使用0.6B模型,模型尺寸略小,对电脑显卡配置要求也更小,但是质量不会差太多...

腾讯混元三维世界重建系统WorldMirror 2.0通用3D三维资产重建工具下载
WorldMirror 2.0 是由腾讯混元(Hunyuan)团队开发的下一代通用三维世界重建系统,底层基于 HY-World-2.0 模型。它能够从一组普通照片或一段视频中,自动恢复出场景的三维结构,并生成多种形式的三维资产,包括: 我基...

阿里Qwen3-TTS高质量声音克隆语音合成系统,AI视频配音多人对话生成工具
Qwen3-TTS 是由阿里 Qwen 团队开发的新一代语音合成系统,基于自研的 Qwen3-TTS-Tokenizer-12Hz 编解码器和离散多码本 LM 架构,实现了端到端的全信息语音建模。它突破了传统级联架构的信息瓶颈,支持音色克隆...

PasteMD:一键将 Markdown 和网页 AI 对话文本内容粘贴到 Word、WPS 和 Excel
PasteMD:一键将 Markdown 和网页 AI 对话(ChatGPT/DeepSeek等)完美粘贴到 Word、WPS 和 Excel 的效率工具。 在写论文或报告时,从 ChatGPT / DeepSeek 等 AI 网站中复制出...

BiliNote:自动生成B站油管视频笔记,AI视频内容总结工具
在信息爆炸的时代,视频已经成为最重要的知识载体之一。但相比文字,视频的“可检索性”和“复用效率”始终较低。如何快速从长视频中提取重点、形成结构化知识,成为很多学习者和创作者的痛点。 而 BiliNote 正是为解决这一问题而诞生的一款开源 ...

优云智算HappyHorse AI 视频生成API KEY WebUI
大家可能平常刷视频的时候已经发现了,进入2026年AI短剧极其火爆,不管是短视频平台还是拼多多等购物平台,短剧视频里经常能刷到AI漫剧。前几年短剧公司拍真人短剧赚的盆满钵满,进入2026年短剧公司被AI打的毫无还手之力。借助AI的快速发展,...

LTX-2.3 视频生成免安装部署整合包软件下载
LTX-2 是由 Lightricks 开发的首个基于 DiT(扩散变换器)架构的音视频基础模型,能够在一个统一模型中同时生成高质量的视频与同步音频。与以往需要分别处理视频和音频的方案不同,LTX-2 将两者深度融合,实现真正的音画同步生成...
windows电脑剪贴板内容管理工具Ditto下载,快速粘贴预设文字内容回复话术
和大家分享一个windows电脑剪贴板内容管理神器Ditto,软件可以快速将预设文字内容填充到指定位置。 由于每天都要写大量文字,有时候还是重复内容,频繁到其它地方复制粘贴的话比较耗时间,所以找到了这款软件,首先佩服一下软件作者,这个软件维...
PDF转word软件FreeP2W免安装版下载
这软件还是很早的时候一个用户让做的,发现没分享过,现在分享一下。 软件主要功能就是把PDF文档转换为word文档 软件使用很简单,把需要处理的pdf文档复制到input文件夹内,双击启动软件.exe,等待处理完成即可。 注意事项 软件只支持...

多人对话有声书制作软件VoxCPM Windows版整合包,高质量声音克隆语音合成工具
前几天调试了刚出的omnivoice,本次再分享一个语音合成(TTS)领域的开源天花板——VoxCPM。我基于原版功能增加了多人对话语音合成功能,因为之前分享的时候有用户有多人对话语音合成需求,这次顺便增加了这个功能。 一、 什么是 Vox...















