V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
andforce
V2EX  ›  机器学习

有没有针对机器学习“图片训练集”的管理软件?

  •  
  •   andforce · 46 天前 · 883 次点击
    这是一个创建于 46 天前的主题,其中的信息可能已经有所发展或是发生改变。

    之前在 V 友的帮助下,已经使用 YOLO 训练好了我需要的模型,( https://www.v2ex.com/t/1077539 ) 由于当前收集的图片样本比较少,我想继续增加训练样本以提高分类精度。

    但目前遇到几个问题:管理这些训练样本很麻烦。

    我现在的操作是,搞一个文件夹收集原始数据,然后统一规划这些数据用于训练。

    [原始数据目录] ---->> {使用 python 统一格式、裁剪、缩放大小} --->> [存放到用于训练的新目录]

    问题 1:

    去重问题,图片来源比较分散,有可能数据会被重复放进 [原始数据目录] 可能是文件名重复(这个还好说),也可能是图片本身是重复的

    问题 2:

    每次搞到新的图片数据,我得打开 Finder 一层一层找到归类子文件夹放进去 感觉比较繁琐

    以上,有没有什么管理软件能让我更轻松管理这些数据集合

    2 条回复
    X2031
        1
    X2031  
       46 天前
    jeremyl313
        2
    jeremyl313  
       46 天前
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2528 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 15:38 · PVG 23:38 · LAX 07:38 · JFK 10:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.