V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
kisshere
V2EX  ›  程序员

机器学习新人,想以最快的方式实现 Google 的 Vision AI 或者 clarifai 那样的功能,该怎么做?

  •  
  •   kisshere · 2019-11-20 09:16:40 +08:00 · 1723 次点击
    这是一个创建于 1859 天前的主题,其中的信息可能已经有所发展或是发生改变。

    给出一张照片,能把里面几乎所有的物体识别出来,这方面感觉 Google 的 vision AI 和 clarifai 做的很不错:

    https://cloud.google.com/vision/

    https://www.clarifai.com/demo

    想实现这样的效果,需要选择什么样的框架和数据集,目前我正在学习 YOLO V3,不知道这个框架能不能达到这样的效果?还有没有更好的框架?另外,什么样的数据集来训练最好?

    10 条回复    2019-11-21 15:10:56 +08:00
    lllllliu
        1
    lllllliu  
       2019-11-20 09:40:40 +08:00
    0.0 拿现成的模型用或者做迁移训练他不香么。
    kisshere
        2
    kisshere  
    OP
       2019-11-20 09:41:06 +08:00
    @lllllliu 哪里有现成的模型?
    wangkai0351
        3
    wangkai0351  
       2019-11-20 10:27:50 +08:00
    这些 DL 框架现在工程化了,工程化=踩坑多的人经验多
    locoz
        4
    locoz  
       2019-11-20 10:50:07 +08:00
    仅从标题来说,砸钱
    boyhailong
        5
    boyhailong  
       2019-11-20 10:53:56 +08:00
    最快的速度实现人家商业化的产品?一个人?
    Stain5
        6
    Stain5  
       2019-11-20 10:56:36 +08:00
    android 上又很多类似的 app 下几个下来反编译看看
    Olament
        7
    Olament  
       2019-11-20 12:01:19 +08:00   ❤️ 2
    首先要搞明白你想要做的是 Object Detection 还是 Multi-label Image Classification。 你给的 Clarifai 的 demo 演示的是 Multi-label Image Classification。 但是你提到的 YOLO v1/v2/v3 是一个 Object Detection System。

    对于 YOLO v3 是不是一个好的 Object Detection System,这完全取决于你的应用。比如说你不考虑实际部署,那有很多表现比 YOLO 但是更“重”的 Two-stage Dection State-of-the-art system。参考: https://paperswithcode.com/task/object-detection。 但是如果你要把你的模型部署的实际设备上去,那 YOLO “足够好".

    对于选用数据集的问题, 一般来说 Image Classficiation 采用的都是 ImageNet 训练。Object Detection 我不太熟悉,但是 COCO 似乎是一个比较流行的数据集。但是,对于这些大家研究的都比较透彻的 Computer Vision task,不推荐你自己来训练模型,主要是搭建模型和训练模型如果没有相关经验会踩很多坑。完全可以下载别人已经训练好的模型,比如: https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md
    MOONLIGHTT
        8
    MOONLIGHTT  
       2019-11-20 20:09:20 +08:00
    毕设的时候用 SSD 做了一个人脸检测系统,训练数据集用的 wider face。
    kisshere
        9
    kisshere  
    OP
       2019-11-21 09:56:03 +08:00
    @Olament 感谢大神回答,请问你说的 https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md

    这里面哪个模型能实现 clarifai 那样的精准度?
    Olament
        10
    Olament  
       2019-11-21 15:10:56 +08:00   ❤️ 1
    @kisshere 我给的这个连接是 pre-trained 物体检测模型。Clarifai 演示的是 多标签图像分类。所以这两个实现的不是任务。
    关于有没有公开的模型能达到 Clarifai 的精度的问题。我搜索了一下,没有发现 Clarifai 自己有公开自己模型的性能。所以精度也无从比较。而且,一般来说,计算机视觉模型的性能不仅仅取决于模型的架构,和训练时采用的数据集也有关系。Clarifai 肯定用了自己收集的 非公开 的数据集来训练模型,而且模型估计也跑在多个 GPU 上,所以自己单机的训练的模型应该很达到 Clarifai 的精度。

    https://github.com/tensorflow/models/tree/master/research/slim#Pretrained
    这个连接是 TensorFlow 官方给出的预训练的图像分类模型,我推荐你可以自己下一个 ResNet 50/101/152 (模型大小取决于你的 GPU ),然后看看能不能满足的需求
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1558 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 67ms · UTC 00:00 · PVG 08:00 · LAX 16:00 · JFK 19:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.