M3 Ultra 的 Mac studio 或许是本地部署大模型的最佳利器？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

144 总核心，512G 统一内存，819G/s 带宽，超越 M1 Ultra16.9 倍的 LLM 令牌生成速度，看起来是本地部署 LLM 的最佳利器？双机 EXO 或单机 INT4 即可部署 Deepseek 671B 全量模型？

8 条回复 • 2025-03-06 12:10:26 +08:00

Donaldo

1 天前

exo 会让速度变慢很多。

mumbler

1 天前

只是为了能跑的话，阿里云租一台 512G 内存 ECS ，一个小时几元钱而已，但慢得完全不可用

其实不用追求 671B ，按目前发展速度，明年 70B 或者 32B 就能达到现在 671B 的水平

ajaxfunction

23 小时 46 分钟前

@mumbler 阿里云的 512g 内存，和 mac 的 512g 内存不是一回事吧。
mac 是内存=显存，

mayli

23 小时 44 分钟前

最佳指的是体积最小？

whileFalse

20 小时 17 分钟前

我来发表暴论：需要自己研究怎么部署 671B 的人，99%不需要本地 671B 。

mandex

13 小时 56 分钟前

怎么不是 M4 Ultra 啊？

idblife

13 小时 43 分钟前

@Donaldo
实际测试过？

Donaldo

12 小时 6 分钟前

@idblife #7 是啊，它传输靠的是网络。