V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
unboy
V2EX  ›  Mac Studio

M3 Ultra 的 Mac studio 或许是本地部署大模型的最佳利器?

  •  
  •   unboy · 1 天前 · 551 次点击
    144 总核心,512G 统一内存,819G/s 带宽,超越 M1 Ultra16.9 倍的 LLM 令牌生成速度,看起来是本地部署 LLM 的最佳利器?双机 EXO 或单机 INT4 即可部署 Deepseek 671B 全量模型?
    8 条回复    2025-03-06 12:10:26 +08:00
    Donaldo
        1
    Donaldo  
       1 天前
    exo 会让速度变慢很多。
    mumbler
        2
    mumbler  
       1 天前
    只是为了能跑的话,阿里云租一台 512G 内存 ECS ,一个小时几元钱而已,但慢得完全不可用

    其实不用追求 671B ,按目前发展速度,明年 70B 或者 32B 就能达到现在 671B 的水平
    ajaxfunction
        3
    ajaxfunction  
       23 小时 46 分钟前
    @mumbler 阿里云的 512g 内存,和 mac 的 512g 内存不是一回事吧。
    mac 是内存=显存,
    mayli
        4
    mayli  
       23 小时 44 分钟前
    最佳指的是体积最小?
    whileFalse
        5
    whileFalse  
       20 小时 17 分钟前
    我来发表暴论:需要自己研究怎么部署 671B 的人,99%不需要本地 671B 。
    mandex
        6
    mandex  
       13 小时 56 分钟前
    怎么不是 M4 Ultra 啊?
    idblife
        7
    idblife  
       13 小时 43 分钟前
    @Donaldo
    实际测试过?
    Donaldo
        8
    Donaldo  
       12 小时 6 分钟前
    @idblife #7 是啊,它传输靠的是网络。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1920 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:17 · PVG 00:17 · LAX 08:17 · JFK 11:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.