AI软件下载
有趣网站推荐及实用软件下载

OmniSVG:统一的可缩放矢量图形生成软件

OmniSVG 是一个基于视觉-语言模型(VLM)的端到端多模态 SVG(可缩放矢量图形)生成框架,由 OpenVGLab 团队开发。该项目能够从文本描述参考图像生成高质量的 SVG 矢量图形,覆盖从简单图标到复杂插画乃至动漫角色的广泛范围。

OmniSVG:统一的可缩放矢量图形生成软件

核心功能特点

1. 双模式 SVG 生成

OmniSVG 支持两种生成模式:

模式输入输出应用场景
Text-to-SVG文本描述SVG 矢量图形根据文字描述生成图标、插画、Logo 等
Image-to-SVG参考图片SVG 矢量图形将位图(PNG/JPG 等)转换为可缩放矢量图

2. 多尺寸模型选择

提供三种不同规模的预训练模型,用户可根据硬件条件灵活选择:

模型参数量显存需求特点
OmniSVG1.1_8B8B>16GB最高质量,适合复杂插画和精细细节
OmniSVG1.1_4B4B>8GB速度与质量平衡,适合大多数场景

3. 多候选生成机制

  • 每次生成可产生 4~8 个候选 SVG 结果
  • 由于生成存在随机性,多候选机制确保用户总能从中挑选最佳结果
  • 每个候选 SVG 会显示路径数量(path count),方便评估复杂度

4. 丰富的参数调节能力

提供细粒度的生成参数控制:

  • Temperature:控制生成随机性,低值更准确,高值更多样
  • Top-P / Top-K:控制采样范围
  • Repetition Penalty(重复惩罚):防止生成重复模式
  • Max Token Length:控制 SVG 的复杂度(256~2048 tokens)
  • Number of Candidates:生成候选数量

5. 智能图像预处理

  • 自动检测并替换非白色背景
  • 支持 RGBA 透明通道图片
  • 自动调整图像尺寸至标准输入大小
  • 边缘采样检测背景颜色

6. 自动任务类型检测

系统能根据文本描述自动判断生成类型:

  • 图标模式:检测到 icon/logo/symbol/arrow/triangle 等关键词
  • 插画模式:检测到 illustration/scene/person/animal/house 等关键词或较长描述

不同模式自动应用不同的默认生成参数。


软件使用介绍

首先将网盘内的软件压缩包下载到本地电脑并解压,双击启动软件.bat,稍后会自动打开webui操作界面

界面整体布局

应用采用现代化 UI 设计,包含以下主要区域:

提示指南区

界面内置了详尽的 Prompt 使用指南,包含:

  • 提示框(CRITICAL):核心建议
    • 生成 4-8 个候选并挑选最佳
    • 使用几何描述(triangular roof, circular head 等)
    • 为每个元素指定颜色
    • 描述位置和方向
    • 保持描述简洁
  • 蓝色提示框:模型选择指南
    • 8B 模型:高质量,需 ~16GB+ 显存
    • 4B 模型:更快,需 ~8GB+ 显存
  • 分类提示卡片
    • Icons & Simple Shapes(图标与简单形状)
    • Animals(动物)
    • Buildings & Objects(建筑与物体)
  • 快速故障排除:针对不同问题的参数调整建议

功能标签页

标签页一:Image-to-SVG(图片转 SVG)

输入区域(左侧面板):

  • 图片上传:支持拖拽上传、文件选择、剪贴板粘贴(Ctrl+V)
  • 模型选择:下拉菜单选择 8B 或 4B 模型
  • 候选数量:滑块 1~8 个
  • 背景替换:复选框,启用后自动检测并替换非白色背景
  • 最大 Token 长度:滑块 256~2048
  • 高级参数(可折叠):
    • Temperature:0.1~1.0
    • Top-P:0.5~1.0
    • Top-K:10~100
    • Repetition Penalty:1.0~1.3
  • 模型状态:显示当前加载的模型信息
  • 示例图片:如果 examples 目录存在,显示示例图片供快速测试

输出区域(右侧面板):

  • 预处理后的输入图像:显示经过背景处理后的图像
  • 生成的 SVG 候选画廊:以网格形式展示所有候选 SVG 的预览图,鼠标悬停有放大效果,每个候选显示路径数量
  • SVG 代码:以代码编辑器形式展示所有候选的 SVG 源码

标签页二:Text-to-SVG(文本转 SVG)

输入区域(左侧面板):

  • 文本输入框:输入 SVG 描述,支持多行
  • 模型选择:同图片模式
  • 候选数量:默认 6 个
  • 最大 Token 长度:滑块 256~2048
  • 高级参数(可折叠):同图片模式,但默认值针对文本生成优化
  • 模型状态:显示当前加载的模型信息
  • 30 个示例提示词:覆盖以下类别:
    • 简单图标(三角形、心形、星形、箭头等)
    • 人物(站立、女孩、挥手、坐姿、跑步)
    • 头像与肖像(圆形头像、女性头像、侧影、卡通、职业照)
    • 风景与场景(山脉、海滩、森林、城市天际线、沙漠、乡村)
    • 动物(猫、鸟、狗、狐狸)
    • 物品与杂项(房子、咖啡杯、书)

输出区域(右侧面板):

  • 生成的 SVG 候选画廊:网格展示所有候选 SVG
  • SVG 代码:代码编辑器展示 SVG 源码

技术实现细节

模型管理:

  • 支持按需加载模型,首次生成时加载
  • 切换模型时自动释放旧模型并清理 GPU 缓存

图像处理管线:

  1. 输入图像 → RGBA 透明背景处理 → 白色背景合成
  2. 边缘采样检测背景颜色 → 可选背景替换
  3. 调整至标准尺寸(默认 448×448)

SVG 生成管线:

  1. 文本/图像 → Qwen2.5-VL 处理器编码
  2. SketchDecoder 生成 SVG token 序列
  3. SVGTokenizer 解码 token 为 SVG 路径
  4. CairoSVG 渲染 SVG 为 PNG 预览
  5. 有效性验证(长度、空图像检测等)

Prompt 编写最佳实践

推荐结构

[主体] + [带颜色的形状描述] + [位置/方向] + [风格]

示例

"A fox logo: triangular orange head, pointed ears, white chest marking, 
 facing right. Minimalist flat style, centered."

关键技巧

  1. 使用几何描述:triangular roof, circular head, rectangular body
  2. 明确每个元素的颜色:red roof, blue shirt, black outline
  3. 描述位置和方向:centrally positioned, pointing upward, facing right
  4. 保持简洁:用短句 + 逗号连接,避免复杂句式
  5. 生成多个候选:4-8 个,从中挑选最佳

SVG可缩放矢量图生成软件OmniSVG下载链接:

https://pan.quark.cn/s/6812c466fab1


AI软件用不了?2元爽玩4090: 立即体验>>

热门大语言模型API免费体验: 立即获取>>

软件催更及1对1人工答疑支持: https://nuowa.net/1806
赞(0) 打赏
软件无法使用?点击查看常见问题说明>>

最近更新

Studio One Pro 7免费开心版下载-诺瓦小站

Studio One Pro 7免费开心版下载

Studio One 7是一款专业数字音频工作站(DAW)软件,它是音乐制作、混音、母带处理与现场演出一体化的旗舰软件。 ✨ 核心功能 1. AI 智能音轨分离(Stem Separation) AI 驱动的音轨分离功能允许用户将混缩后的音...

优云智算HappyHorse AI 视频生成API KEY WebUI-诺瓦小站

优云智算HappyHorse AI 视频生成API KEY WebUI

大家可能平常刷视频的时候已经发现了,进入2026年AI短剧极其火爆,不管是短视频平台还是拼多多等购物平台,短剧视频里经常能刷到AI漫剧。前几年短剧公司拍真人短剧赚的盆满钵满,进入2026年短剧公司被AI打的毫无还手之力。借助AI的快速发展,...

觉得文章对你有帮助就打赏一下作者

非常感谢你的打赏,我将有更多的动力继续提供优质内容,让我们一起创建更加美好的世界!

支付宝扫一扫

微信扫一扫