本次和大家分享一个非常热门的应用ultralytics,Ultralytics 开发的 YOLO 是一个高效、灵活的开源目标检测框架,支持 YOLO多个版本。它专注于实时目标检测任务,同时扩展了图像分类、实例分割、姿态估计等多种功能。使用场景有监控、工业质检、物流识别管理等等,YOLO的功能很强大,用途很广。

ultralytics整合包使用说明
软件下载解压后直接双击【启动软件.exe】即可打开UI界面。
首先选择待处理文件,可以是图片或视频的路径地址,如果选择处理摄像头内容的话输入框里填0
保存位置即处理结果保存目录
模型即yolo模型
置信度阈值就是物体识别检测结果是否更可靠更接近1,如果识别物体值低于这个值的话就不标记处理。置信度阈值范围(0~1),自己操作一下就明白效果了。
IoU 阈值(0~1)用于衡量预测的边界框与真实目标的边界框之间的重叠程度。
其中:
- iou=0.5 (默认值):如果两个框的 IoU > 0.5,较低置信度的框会被过滤掉
- iou=0.3 (更严格):会保留更多框,可能导致重复检测
- iou=0.7 (更严格):只保留重叠度非常高的框
- 提高 IoU 阈值(0.7~0.9) → 减少重复框,但可能会 丢失一些目标
- 降低 IoU 阈值(0.3~0.5) → 保留更多目标,但可能会 产生多个重叠的框
说起来有些抽象,还是需要自己去实际使用一下体会体会
指定类别就是你想要检测什么物体,0人,1自行车,2汽车,只检测人的话这里就填0,人和汽车,这里就填0,2,用英文逗号隔开。
YOLO物体类别代码如下:
点击展开详细内容>>
| 索引 | 类别名称 | 索引 | 类别名称 | 索引 | 类别名称 |
|---|---|---|---|---|---|
| 0 | person(人) | 1 | bicycle(自行车) | 2 | car(汽车) |
| 3 | motorcycle(摩托车) | 4 | airplane(飞机) | 5 | bus(公交车) |
| 6 | train(火车) | 7 | truck(卡车) | 8 | boat(船) |
| 9 | traffic light(红绿灯) | 10 | fire hydrant(消防栓) | 11 | stop sign(停车标志) |
| 12 | parking meter(停车计时器) | 13 | bench(长凳) | 14 | bird(鸟) |
| 15 | cat(猫) | 16 | dog(狗) | 17 | horse(马) |
| 18 | sheep(羊) | 19 | cow(牛) | 20 | elephant(大象) |
| 21 | bear(熊) | 22 | zebra(斑马) | 23 | giraffe(长颈鹿) |
| 24 | backpack(背包) | 25 | umbrella(雨伞) | 26 | handbag(手提包) |
| 27 | tie(领带) | 28 | suitcase(行李箱) | 29 | frisbee(飞盘) |
| 30 | skis(滑雪板) | 31 | snowboard(单板滑雪) | 32 | sports ball(球) |
| 33 | kite(风筝) | 34 | baseball bat(棒球棒) | 35 | baseball glove(棒球手套) |
| 36 | skateboard(滑板) | 37 | surfboard(冲浪板) | 38 | tennis racket(网球拍) |
| 39 | bottle(瓶子) | 40 | wine glass(酒杯) | 41 | cup(杯子) |
| 42 | fork(叉子) | 43 | knife(刀) | 44 | spoon(勺子) |
| 45 | bowl(碗) | 46 | banana(香蕉) | 47 | apple(苹果) |
| 48 | sandwich(三明治) | 49 | orange(橙子) | 50 | broccoli(西兰花) |
| 51 | carrot(胡萝卜) | 52 | hot dog(热狗) | 53 | pizza(披萨) |
| 54 | donut(甜甜圈) | 55 | cake(蛋糕) | 56 | chair(椅子) |
| 57 | couch(沙发) | 58 | potted plant(盆栽) | 59 | bed(床) |
| 60 | dining table(餐桌) | 61 | toilet(厕所) | 62 | TV(电视) |
| 63 | laptop(笔记本电脑) | 64 | mouse(鼠标) | 65 | remote(遥控器) |
| 66 | keyboard(键盘) | 67 | cell phone(手机) | 68 | microwave(微波炉) |
| 69 | oven(烤箱) | 70 | toaster(烤面包机) | 71 | sink(洗手池) |
| 72 | refrigerator(冰箱) | 73 | book(书) | 74 | clock(时钟) |
| 75 | vase(花瓶) | 76 | scissors(剪刀) | 77 | teddy bear(泰迪熊) |
| 78 | hair drier(吹风机) | 79 | toothbrush(牙刷) | – | – |
GPU加速就是是否使用显卡来加快处理
保存裁剪后的目标就是只保存识别出来的目标
YOLO格式结果就是是否以txt文档保存YOLO格式的识别结果
注意事项
整合包只支持Windows 10或11系统
软件运行路径中不要有非英文字符和空格
ultralytics物体实时目标识别检测软件整合包下载链接
相关推荐
AI描述万物软件describe-anything整合包,精准描述图片视频中指定区域内容
BiliNote:自动生成B站油管视频笔记,AI视频内容总结工具
优云智算HappyHorse AI 视频生成API KEY WebUI
LTX-2.3 视频生成免安装部署整合包软件下载
FlashVSR低分辨率模糊视频高清放大工具整合包v1.1下载,免安装一键启动
人物动作迁移及视频人物替换软件Wan2.2-Animate-14B整合包下载,动作模仿视频换主体工具在线一键启动
无限长度的数字人对话视频生成软件InfiniteTalk整合包,图像转视频、视频配音对口型工具
Wan2.2-S2V-14B:音频驱动图片转视频生成本地整合包及在线一键启动
最近更新

AI漫剧制作即梦seedance2.0教程及提示词2026年最新版分享
AI视频依旧持续火爆,各种类型的AI视频层出不穷,视频效果也是越来越好,甚至快接近影视级,目前最主要的AI视频生成工具还是即梦,即梦 Seedance 2.0生成视频一秒钟都到2块多钱了😂,不过也没办法,还是得用,目前还没能有替代即梦see...

AI实时语音聊天对话系统,外语口语陪练/虚拟好友实时语音交流
AI 实时语音对话系统 是一款集语音识别(ASR)、大语言模型(LLM)对话、语音合成(TTS)于一体的实时语音交互软件。用户通过麦克风说话,系统自动识别语音内容并转为文字,交由 AI 角色进行智能回复,最终将回复内容合成为语音实时播放,实...

ComfyUI 三参考图生图工作流,虚拟试衣、换脸、图片内容整合
本工作流核心能力是将三张不同角度、内容的参考图,通过 AI 理解融合,生成一张新的图像,新图像内容根据描述词指令生成。工作流集成了阿里巴巴的 Qwen2.5-VL 多模态大模型(图像编辑版本)与 SeedVR2 超分辨率放大模型,实现了「理...
comfyui CUDA128+torch 2.8.0+python3.12最新纯净版一键启动整合包
comfyui官方发布的最新版便携包是基于torch 2.11+CU130 +Python 3.13版本制作的,Python版本和torch版本都太新了,windows电脑上安装某些节点的时候会有冲突报错,有时候就算能安装上也会比较麻烦,感...
LTX2.3+comfyui音频驱动视频生成工作流
这是一个基于 ComfyUI 的 LTX 2.3 音视频同步生成工作流,核心功能是上传一段音频 + 参考图片(可多张图),自动生成与音频内容对应的视频,适合制作人物说话、唱歌等口型同步视频。工作流使用8位量化版ltx2.3模型,显存需求降低...
LTX2.3+comfyui分段提示词图片转视频工作流,AI视频带货生成器
再和大家分享一个基于 ComfyUI 的 AI 分段提示词图生视频工作流,本工作流主要基于模型LTX2.3和PromptRelay实现。可使用PromptRelay分时段控制生成不同视频画面或合成语音内容。 📌 工作流简介 本工作流是一套基...
windows电脑C盘垃圾查找清理软件
电脑用了好几年了,尽管我安装软件从来不主动装到C盘,偶尔也会清理垃圾,但是用的久了,容量也是在慢慢减少。我C盘303G,现在就剩了24G了,已经会影响到系统性能和虚拟内存调度了,已经不能不管了。C盘不装软件的话大多都是缓存,文件太多了,有时...

LTX2.3+comfyui视频去除字幕水印工作流分享
本次再和大家分享一个视频去字幕水印的comfyui工作流,工作流基于LTX2.3视频生成模型制作。LTX2.3是最新最强的视频生成模型,我前段时间就分享过了,可以看我另一篇文章:https://nuowa.net/2525,comfyui项...

多人对话声音克隆语音合成工具Chatterbox TTS免安装版,AI实时文字转语音
Chatterbox 是由 Resemble AI 开发的开源文本转语音(Text-to-Speech, TTS)模型,支持零样本音色克隆:只需提供一段参考音频(几秒钟的人声),即可模仿该音色朗读任意文本。我基于最新版源码制作了免安装一键启...
Mineru PDF转markdown软件局域网版
对于有的电脑配置比较低或是win7系统等电脑无法使用Mineru情况,可以使用局域网内可运行软件的电脑运行Mineru,然后其它电脑或手机等终端输入IP地址,打开运行软件的IP地址来使用Mineru。 具体用法: 下载局域网版压缩包到本地电...

















