V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  jinja27  ›  全部回复第 1 页 / 共 1 页
回复总数  6
15 小时 27 分钟前
回复了 jinja27 创建的主题 程序员 8 路 L40 部署 R1-671B 上限是多少呢
@Attenton 而且我下载的 671B 4bit 量化是 gguf 格式,VLLM 运行不了
17 小时 3 分钟前
回复了 jinja27 创建的主题 程序员 8 路 L40 部署 R1-671B 上限是多少呢
@kk2syc
给过了,模型共 61 层,GPU 上只有 40 层,再大显存就不够了,但是 40 层显卡几乎没工作
17 小时 5 分钟前
回复了 jinja27 创建的主题 程序员 8 路 L40 部署 R1-671B 上限是多少呢
@Attenton
500G 是内存,显存的话每张显卡实际可用的只有 44 左右,8*44 约 350G
17 小时 14 分钟前
回复了 jinja27 创建的主题 程序员 8 路 L40 部署 R1-671B 上限是多少呢
@guoyijun163
但是 KT 不是走纯 CPU 方案吗?这样 8 路显卡的资源浪费不是更严重了?
351 天前
回复了 hepin1989 创建的主题 生活 发现穷人的孩子真的难翻身
@ttvv123 比特币除非上杠杆和玩合约,可以说是最近 10 几年最优质的投资资产了,你知道这些只能说明你认识的都是赌狗
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   924 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 22:49 · PVG 06:49 · LAX 14:49 · JFK 17:49
Developed with CodeLauncher
♥ Do have faith in what you're doing.