A30 显卡-24G 显存，推荐部署什么大模型呢

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 35 天前的主题，其中的信息可能已经有所发展或是发生改变。

想部署一个不带推理的大模型，推理耗时太长了。

现在部署的是智谱清言的 chatglm4-9b-chat ，请问有更合适的模型推荐嘛？

符合下面条件：

求哥哥们推荐！！

顺便求一个相对权威的大模型排行榜

8 条回复 • 2025-03-28 10:02:12 +08:00

jackerbauer

35 天前

deepseek-r1 14B

ZimaBlueee

35 天前

@jackerbauer 不需要推理哈，推理的时间太长了

linauror

35 天前

你的意思应该是不需要思考过程吧，大模型都是要推理的 O(∩_∩)O

liu731

35 天前

cat9life

35 天前

那必须是 QwQ-32B ，当红炸子鸡

ZimaBlueee

35 天前

@linauror 这个名词我找 ai 问过，ai 说思考过程是拟人化的表达，表述成显示化推理会更准确。。我也分不清了 QAQ

ijk0

29 天前 via iPhone

hefish

20 天前

别指望聪明，我感觉越聪明的模型，也越会胡说八道。