V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
x97bgt
V2EX  ›  程序员

怎么快速上手 AI 的开发和应用?

  •  1
     
  •   x97bgt · 2023-02-18 11:29:45 +08:00 · 3556 次点击
    这是一个创建于 643 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想浅尝一下 AI 的东西,比如:

    • 往小了说:训练一个自己和家人的图像识别模型,集成智能家居。
    • 往大了说:训练一个类 chatGPT 的语言模型。

    但我对此的知识为 0 ,怎么才能快速上手?不要科班式的学习过程,那样要花的时间太多了。侧重应用而不是理论。

    17 条回复    2023-02-20 08:52:50 +08:00
    mepwang
        1
    mepwang  
       2023-02-18 11:35:24 +08:00
    选一个别人训练好的模型,在使用自己的目标数据集做迁移学习。
    对效果别抱太大幻想,毕竟需要算力支撑
    tensorzhang
        2
    tensorzhang  
       2023-02-18 11:49:36 +08:00
    借助成熟的产品,例如百度的 https://ai.baidu.com/easydl/
    只需要你提供数据集
    luckyx
        3
    luckyx  
       2023-02-18 12:21:35 +08:00
    call API from GPT-3

    自己研究一个 YOLO
    hst001
        4
    hst001  
       2023-02-18 12:45:13 +08:00
    学习一下理论就好了,最新的这些 AI ,不像软件开发,个人没钱没资源很难玩起来
    NoOneNoBody
        5
    NoOneNoBody  
       2023-02-18 14:18:15 +08:00
    应用 AI 很简单,很多成熟模块,成品代码也有,也没多少行,改很少就能用
    难点是在于建库,尤其是私人项目,如果分配 100 天的话,从采集到训练要调试 95 天,最后应用调试只需 5 天

    个人基本很难做 chatGPT 这种项目的,因为数据庞大,别说单机跑不了,单说数据采集就已经是“入门到放弃”
    czfy
        6
    czfy  
       2023-02-18 16:12:13 +08:00   ❤️ 1
    不经过科班式的学习,就会问出这样的问题:
    怎样快速训练一个类 chatGPT 的语言模型

    你身家有一亿吗?
    x97bgt
        7
    x97bgt  
    OP
       2023-02-18 18:33:25 +08:00 via iPhone
    @czfy 这样都能有鄙视链,真是醉了。大家快来瞧瞧,高贵的科班出身的天龙人。
    x97bgt
        8
    x97bgt  
    OP
       2023-02-18 18:35:45 +08:00 via iPhone
    @mepwang
    @tensorzhang
    @luckyx
    @hst001
    @NoOneNoBody
    问个比较傻的问题。是不是可以有那种训练过的半成品,基于之上加入自己的数据,就能个性化一个自己的模型?
    MMMMMMMMMMMMMMMM
        9
    MMMMMMMMMMMMMMMM  
       2023-02-18 18:37:07 +08:00
    个人需求的话,huggingface 整个开源底模,在他基础上加点数据去训练

    这东西值钱的地方在于算法和标注和调试的过程,训练用不了你几个钱,底模人家都给你调好了,剩下的顶多 1000 块
    okakuyang
        10
    okakuyang  
       2023-02-18 21:10:06 +08:00
    去 github 上下载一个项目,把这个项目跑起来就可以完成往小了说。
    abelmakihara
        11
    abelmakihara  
       2023-02-19 01:19:48 +08:00
    上 github 搜别人的 Jupyter Notebook
    稍微有点程序猿常识 点点点即可体验~
    比如拿 gpt2 训练一下小说 比较人工智障
    alsorunning
        12
    alsorunning  
       2023-02-19 01:42:51 +08:00
    快速上手的话,先用用看现有的产品

    - 识别模型那个你可以试试二哈识图
    - 语言模型那个去 openai 自己的 playground 玩玩看
    Juszoe
        13
    Juszoe  
       2023-02-19 14:11:22 +08:00
    给你提供准确的术语关键字
    半成品=>预训练模型(pretrained model)
    个性化=>微调(fine-tune)
    PTLin
        14
    PTLin  
       2023-02-19 17:25:27 +08:00
    我最近在学习 ML 这些东西,我说说我这几天学习的经验吧。
    我认为深度学习所谓的科班应该指的是:完全使用数学理论论证的形式去学习这个领域,要是这么学习确实不仅难度大,而且没有成就感,容易劝退。
    但是想要接触这个领域没有数学知识基本上寸步难行,所以我先看了程序员的数学这本书复习了下以前忘了的数学知识,然后我又看了一本叫深度学习的数学的书来学习了一下梯度下降,反向误差传播公式的推导。
    然后现在我正在看一本叫 Python 深度学习(第二版)的书来学习一下非形式化的机器学习模型搭建的方式和理论基础,看完这本后我准备看看周志华的那本机器学习来补一下数学论证的过程。

    最后回答下你的问题,假如不经过这样的学习的话你面对一个搭建机器学习系统的时候根本不会知道怎么去用,怎么选择层,怎么选择激活函数和损失函数,也不知道数据集如何选择。就拿 mma 的神经网络教程举例,你没有基础根本不知道每一步在做什么 https://reference.wolfram.com/language/tutorial/NeuralNetworksIntroduction.html
    x97bgt
        15
    x97bgt  
    OP
       2023-02-19 22:13:31 +08:00 via iPhone
    @Juszoe 感谢老哥的关键字
    x97bgt
        16
    x97bgt  
    OP
       2023-02-19 22:19:30 +08:00 via iPhone
    @PTLin 对。但学习理论是不是只要掌握大致派别的基本思路和方法就可以?知道模型的派别后,就知道有什么流程,要喂什么参数,怎么评估等等。但对于去深入了解模型,了解其具体方法,这一步是不是就可以省去?毕竟模型那么多,一个个探究总不现实。我这么理解不知道对不对
    smallsung
        17
    smallsung  
       2023-02-20 08:52:50 +08:00
    推荐 吴恩达机器学习 李沐动手学深度学习 https://courses.d2l.ai/zh-v2/
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4459 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 04:04 · PVG 12:04 · LAX 20:04 · JFK 23:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.