总感觉 R1 很罗嗦,是不是需要科研级别的问题才会用到 R1?但是 V3 老是提示服务繁忙..
1
Mjhhh 4 天前
我让它写代码,R1 给出的代码质量会更高
|
![]() |
2
housex 4 天前
DeepSeek-V3
通用型模型:专注于自然语言处理、知识问答、内容创作等通用任务,目标是实现高性能与低成本的平衡,适用于智能客服、个性化推荐系统等场景。 训练重点:通过算法优化降低训练成本,采用多令牌预测( MTP )和无辅助损失负载均衡策略提升效率,支持 128K 上下文窗口。 DeepSeek-R1 推理专用模型:专为数学、代码生成和复杂逻辑推理任务设计,通过大规模强化学习( RL )提升推理能力,对标 OpenAI o1 系列。 创新训练方法:完全摒弃监督微调( SFT ),采用纯强化学 习(如 GRPO 算法)训练基座模型,并通过冷启动数据优化可读性。 具体可以看下这篇: https://zhuanlan.zhihu.com/p/20240802247 |
3
FireKey 4 天前 ![]() 文科 V3 好,理科 R1 强
|
![]() |
4
hokori 4 天前
DeepSeek-V3 专注于自然语言处理、知识问答、内容创作等通用任务
DeepSeek-R1 推理专用模型,专为数学、代码生成和复杂逻辑推理任务设计 大概是这种区分吧 |
![]() |
5
hafuhafu 4 天前
就结果而言肯定是 R1 强。
但是肯定不是啥问题都丢 R1 问,太浪费时间了,简单问题也没啥必要。 我反正是日常丢 V3 ,结果不满意/复杂问题再丢 R1 。其他厂商的模型同理。 |
![]() |
6
Tink 4 天前
V3 写文章好,R1 推理好
|
![]() |
7
IvanLi127 3 天前
R1 很适合我这种话都说不清楚的人,他能硬生生地理解我的意思,能让我少打很多字。
我一般容易说清楚的小问题找 v3 ,难描述的问题找 r1 。 |
![]() |
8
Sting1226 3 天前
R1 ,它会尝试去「理解」你的问题。
|