V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mmtromsb456
V2EX  ›  Apple

TensorFlow 2 现已支持使用 macOS 上可用的 GPU 进行模型加速(包括 Apple Silicon M1)

  •  3
     
  •   mmtromsb456 · 2020-11-19 09:08:06 +08:00 · 4791 次点击
    这是一个创建于 1466 天前的主题,其中的信息可能已经有所发展或是发生改变。
    19 条回复    2020-11-19 15:16:39 +08:00
    mmtromsb456
        1
    mmtromsb456  
    OP
       2020-11-19 09:08:19 +08:00
    简单来说 apple fork 了一份 TensorFlow 并将 ML Compute 框架用作其中,M1 性能大概相当于 1080 ~ 1080Ti 之间
    ltltfuture
        2
    ltltfuture  
       2020-11-19 09:13:22 +08:00 via Android
    接下来就看 pytorch 如何了
    xfrgux
        3
    xfrgux  
       2020-11-19 09:13:55 +08:00
    @mmtromsb456 请问这个相当于 1080 ~ 1080Ti 有数据来源吗 怎么比的呢
    mmtromsb456
        4
    mmtromsb456  
    OP
       2020-11-19 09:17:25 +08:00 via iPhone   ❤️ 2
    zhusimaji
        5
    zhusimaji  
       2020-11-19 09:19:20 +08:00
    apple 不讲武德啊!
    tzm41
        6
    tzm41  
       2020-11-19 09:21:17 +08:00 via iPhone
    爽,今晚试试 resnet 。
    uxstone
        7
    uxstone  
       2020-11-19 09:27:34 +08:00   ❤️ 1
    Apple 杀疯了
    lollxxox
        8
    lollxxox  
       2020-11-19 09:34:43 +08:00
    希望 I 家 A 家和 N 家耗子尾汁,不要再挤牙膏.......
    chich14
        9
    chich14  
       2020-11-19 10:00:09 +08:00
    炼丹,风扇转了吗?
    CommandZi
        10
    CommandZi  
       2020-11-19 10:19:56 +08:00
    专用芯片,不能反映真实性能,下一个
    agagega
        11
    agagega  
       2020-11-19 10:37:36 +08:00
    能支持 NPU 吗?利用起来感觉会更猛啊
    zhaidoudou123
        12
    zhaidoudou123  
       2020-11-19 10:41:12 +08:00 via iPhone
    用自己机器都是玩票性质,现在 m1 的玩票性能起来了,对于初学者来说 n 卡笔记本似乎已经不是必须了
    nnqijiu
        13
    nnqijiu  
       2020-11-19 11:15:37 +08:00
    TensorFlow 不是已经放弃 mac 支持了吗?
    coolmenu
        14
    coolmenu  
       2020-11-19 11:34:48 +08:00
    以后能不能大量购买 M1 芯片,组一个并发网络。10w 的 cpu,比 1080ti 可是省电多啦!!
    lqf96
        15
    lqf96  
       2020-11-19 11:44:56 +08:00   ❤️ 2
    @ltltfuture 好希望早日支持 pytorch,不过 pytorch 似乎也已经在用 Metal Performance Shaders 加速训练和运行了( https://github.com/pytorch/pytorch/pull/46112 )...
    @agagega 目前 ML Compute 只支持 CPU 和 GPU,但是 ML Compute 里面有 ANE 相关的 symbol,所以不排除是目前 Neural Engine 的加速不成熟(因为 MLC 是 macOS 11 和 iOS 14 刚加进来的),以后可能就会支持...

    ```
    00007fff2a15aae2 t +[MLCDeviceANE hasANE]
    00007fff2a22b934 t +[MLCDeviceANE hasANE].cold.1
    00007fff2a15b672 t -[MLCDeviceANE .cxx_destruct]
    00007fff2a15ad57 t -[MLCDeviceANE allocateDeviceMemoryForTensor:]
    00007fff2a22bcad t -[MLCDeviceANE allocateDeviceMemoryForTensor:].cold.1
    00007fff2a15b05c t -[MLCDeviceANE broadcastTensor:]
    00007fff2a22c124 t -[MLCDeviceANE broadcastTensor:].cold.1
    00007fff2a15b0b1 t -[MLCDeviceANE broadcastTensor:batchSize:]
    00007fff2a22c1a3 t -[MLCDeviceANE broadcastTensor:batchSize:].cold.1
    00007fff2a15b309 t -[MLCDeviceANE commitAndWaitForCompletion:]
    00007fff2a22c51c t -[MLCDeviceANE commitAndWaitForCompletion:].cold.1
    00007fff2a15b35e t -[MLCDeviceANE commitAndWaitForCompletion:enableProfiling:graphExecutionTime:graphResultTensor:]
    00007fff2a22c59b t -[MLCDeviceANE commitAndWaitForCompletion:enableProfiling:graphExecutionTime:graphResultTensor:].cold.1

    ...
    ```
    sharpy
        16
    sharpy  
       2020-11-19 11:58:29 +08:00
    有问题,我安装了 mac 提供的 tf 包,运行 mnist demo 时,提示在 eager 模式下 gpu 速度慢。
    用 cpu 时耗时 2s,用 gpu 时耗时 9s 。
    wwqgtxx
        17
    wwqgtxx  
       2020-11-19 12:09:27 +08:00 via iPhone
    @sharpy 做性能测试本来就不该用 eager 模式,而且一般要多运行几个循环来去掉 gpu 初始化的时间
    tzm41
        18
    tzm41  
       2020-11-19 12:42:20 +08:00
    测了一下简单的 CNN,不知为何在我的 MBP 16 上 batch 之间会卡住。
    volvo007
        19
    volvo007  
       2020-11-19 15:16:39 +08:00 via iPhone
    Metal 的话,能外接 a 卡提速吗
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2760 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 07:38 · PVG 15:38 · LAX 23:38 · JFK 02:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.