公司最近要折腾这种东西,想要实现的功能类似拍照打卡的感觉。但是我也不是这个方向的,能做的就是上 yolo 系列打打标签,训练了一下。但效果不尽人意,总是在一些比较奇怪的角度下,将某些不在数据集中的东西识别成了其他物体。不仅数据集数量也很少(普遍十几张,多点也就 60 张左右),而且物体有大有小,唯一优势可能就是物体本身不会发生形变。公司也有 4090 的显卡,不太担心显存的问题。
1
dayeye2006199 2023-09-06 23:14:59 +08:00 1
60 几张其实也差不多了,记得做一下图片增量 -- 旋转,翻转,调调亮度,尽量让模型见一下一些奇怪的角度
|
2
RVRGnXxwawP5kwKW 2023-09-07 00:41:41 +08:00 via iPhone 1
可以在某个大型相似任务的数据集上训练,然后在自己的数据集上 finetune 。
|
3
zzzzzzy 2023-09-07 09:57:12 +08:00 1
一楼的思路是正确的,拍照打卡这种需求,每台手机拍出来的照片也大不相同,各个手机品牌对于拍照的算法也不一样,摄像头也不一样,你需要根据少量的数据集的基础上拓展这个数据集,包括一楼提到的旋转、翻转、调整亮度、锐化、放大、缩小等操作,这样才能提供识别成功率。
|
4
OilMoe OP @dayeye2006199 #1 yolo 5 自带了数据增强的配置文件,使用它的可以吗?还有请问一下,是否可以将沿路拍的东西(不是选择的标志物,比如地板,墙壁)放在训练集中,来防止模型将地板和标志物混淆这种情况有帮助吗
|