V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
joyhub2140
V2EX  ›  分享发现

搭建大模型推理服务有感

  •  
  •   joyhub2140 · 13 小时 19 分钟前 · 813 次点击

    自己在 x86 + nVidia 平台上面,搭建一个 deepseek ,真是怎么快怎么来,舒服一个字。

    在公司华为的昇腾 arm + npu 平台搭建一个 mindie 推理框架,居然让我有种想转行的挫败感,搞死我了(哭。

    第 1 条附言  ·  11 小时 31 分钟前
    ollama 不支持,行,这个本来只适合科研或者原型开发,不适合大规模商用。
    vllm ,适配了,但限定少数型号,公司花大价钱买的型号不在支持范围。

    那就剩下那个什么 mindie 支持部署 deepseek 蒸馏模型,一看那个文档,我勒个去,从业多年我是没见过这么复杂的部署方式,还要用一大坨一大坨 python 代码验证。
    zqqian
        1
    zqqian  
       12 小时 45 分钟前
    学会克服在别的地方不存在的困难
    cyp0633
        2
    cyp0633  
       12 小时 43 分钟前
    恐怕昇腾在一众信创方案里已经算简单的了,华为还是真想拿来卖钱的
    frankies
        3
    frankies  
       12 小时 18 分钟前
    搞信创就这样,平白无故增加毫无意义的工作量,不过习惯就好啦,又不是不给工资😂
    mumbler
        4
    mumbler  
       11 小时 14 分钟前
    你会在昇腾上搭建 deepseek ,你知道这个技能值多少钱吗?帮一个公司搭一套收 10 万一点都不多
    zhaoxj58
        5
    zhaoxj58  
       9 小时 6 分钟前
    老哥,真有这么值钱?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2524 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 15:36 · PVG 23:36 · LAX 07:36 · JFK 10:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.