关于 M1 Max| M1 Pro 测试一些深度学习任务

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

Support

› 根据产品序列号查看状态

有用链接

› Apple 产品更新周期

› Other World Computing 性能升级

› Apple 软件 Beta 测试

这是一个创建于 1213 天前的主题，其中的信息可能已经有所发展或是发生改变。

有没有到货的老哥做一下简单 baseline 的测评对比，用 tf(torch 可能适配还不完整)训的话相当于隔壁什么卡捏？

26 条回复 • 2022-05-29 10:58:44 +08:00

ElliotQi

2021-10-26 23:23:40 +08:00

尝试搜了下，还没看到相关测评的视频儿

INFP

2021-10-26 23:28:44 +08:00

只能用 cpu 做，torch 用不了苹果的 gpu

ElliotQi

2021-10-26 23:35:56 +08:00

@INFP tf 有测过吗?m1 我跑过一个小模型，当时报错还蛮多...提了 issue 后不知道修复没

kuhung

2021-10-26 23:49:14 +08:00 via iPhone

今天好像看到一个视频：深度学习没啥大提升，相较于旧款独显速度反而更慢，原因是 tf 还没支持好。然后苹果说在做优化了🐶……

INFP

2021-10-26 23:54:55 +08:00

@ElliotQi

torch M1 一开始就可以用，比我测试的 i5-8400 快很多很多，不过 8400 也不是什么好 cpu 就是了。
可能我跑的 demo 没那么复杂，没出现过报错。

INFP

2021-10-26 23:55:03 +08:00

@ElliotQi tf 不行

INFP

2021-10-26 23:56:00 +08:00

@ElliotQi tf 当时官方挂了个适配版的仓库，说是快多少多少，然后就没消息了

ElliotQi

2021-10-27 00:00:19 +08:00

@kuhung 苹果还优化啥...coreml 至今是个迷🐶

forgetlight

2021-10-27 00:01:40 +08:00

做深度学习的还是 remote vscode cluster; colab 吧.. 前几天还在推特上看到一堆人在讨论, 用 m1 的都在劝退想要用这个机器的多 learning 的.

ElliotQi

2021-10-27 00:03:30 +08:00

@INFP torch cpu 推理我也试过速度不算很慢吧。就是这 gpu 和神经网络引擎就摆在那，却用不了也太难受了
平时 debug 还是有这种需求的，如果 m1 max 算力可以推动生态的话，手上 m1 想吃这波红利...不只当成一个 ssh 机器

INFP

2021-10-27 00:11:59 +08:00

@ElliotQi 除非有集群用的那种苹果芯片，不然个人单机 debug 的应用场景不太值得他们去适配 Metal

ZRS

2021-10-27 01:27:27 +08:00

刚才找了一圈暂时还没看到有人做评测

rpman

2021-10-27 02:02:06 +08:00 via iPhone

@ElliotQi 主要是需求太少了，也就学校喜欢搞这套

deetz

2021-10-27 05:40:37 +08:00

M1 是有的，不过我也在等 M1 pro 和 M1 max 。

M1 的结果见下，也有同 colab 的对比。
https://www.mrdbourke.com/m1-macbook-vs-intel-macbook-speed-comparison/

deetz

2021-10-27 05:43:14 +08:00

@ZRS ifanr 提了一嘴但是说测试报错了。他们没有更新测试工具，或者没有能力用适配了 apple silicon 的 tensorflow 自己写代码来做。

makeitwork

2021-10-27 07:30:38 +08:00

@deetz 不错，刚入了 max
刚跑了一下，报错，晚点搞好环境再看看

xdays

2021-10-27 08:02:26 +08:00

https://github.com/tlkh/tf-metal-experiments/blob/main/README.md#experiments-and-benchmarks

makeitwork

2021-10-27 08:05:28 +08:00

@xdays 跟 3090 对比，差距很大啊

telaviv

2021-10-27 08:23:31 +08:00

torch 只支持 CPU ，tensorflow 能用 GPU 。

ekidona

2021-10-27 08:32:03 +08:00 via iPhone

果家可能还在搞一些类似于 CUDA 和 RoCM 的工具，等这些成熟了 Unified Memory + Neural Architecute 的优势才会体现出来，现阶段不存在什么可比性。

deetz

2021-10-27 09:02:13 +08:00

@ekidona 可能性比较小。几个理由：

1 ）现在 ML 大头还是在 2B 客户和数据中心上，预训练模型规模越来越大，单机没法处理。
2 ）从技术上讲，Apple 自己的模型训练也是跑在集群的 GPU 上的。
3 ） Apple 自己的 ML 团队管理也很混乱。前段时间 apple health 团队内部纷争是一个例子。

第一点说明从市场上来说没有利润驱动的动力，第二三点说明内部的动力可能也比较小。

makeitwork

2021-10-27 10:05:16 +08:00

说白了，阻止炼丹师用 m1max 的最大理由是 pytorch 不支持（短期内也不可能支持） m1max 。一票否决了。tf 在发论文的那群人里已经没人用了。

liutian9

2021-10-27 11:42:30 +08:00

@deetz 同意，果子内部硬件团队地位碾压软件，要做个 in house CUDA 级别的工具肯定没法说服上面投入足够的资源

ekidona

2021-10-28 15:20:36 +08:00 via iPhone

@deetz 大佬也是果家的嘛？

2NUT

2022-05-29 10:50:10 +08:00

@makeitwork #22 现在支持了

ElliotQi

2022-05-29 10:58:44 +08:00

@2NUT 很多 ops 还不能用，再等等吧