ds 的 V3 和 R1 哪个好用?

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 38 天前的主题，其中的信息可能已经有所发展或是发生改变。

总感觉 R1 很罗嗦,是不是需要科研级别的问题才会用到 R1?但是 V3 老是提示服务繁忙..

服务繁忙

8 条回复 • 2025-02-28 11:19:06 +08:00

Mjhhh

38 天前

我让它写代码，R1 给出的代码质量会更高

housex

38 天前

DeepSeek-V3
通用型模型：专注于自然语言处理、知识问答、内容创作等通用任务，目标是实现高性能与低成本的平衡，适用于智能客服、个性化推荐系统等场景。
训练重点：通过算法优化降低训练成本，采用多令牌预测（ MTP ）和无辅助损失负载均衡策略提升效率，支持 128K 上下文窗口。
DeepSeek-R1
推理专用模型：专为数学、代码生成和复杂逻辑推理任务设计，通过大规模强化学习（ RL ）提升推理能力，对标 OpenAI o1 系列。
创新训练方法：完全摒弃监督微调（ SFT ），采用纯强化学
习（如 GRPO 算法）训练基座模型，并通过冷启动数据优化可读性。
具体可以看下这篇： https://zhuanlan.zhihu.com/p/20240802247