V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
crocoBaby
V2EX  ›  问与答

ds 的 V3 和 R1 哪个好用?

  •  
  •   crocoBaby · 4 天前 · 1447 次点击

    总感觉 R1 很罗嗦,是不是需要科研级别的问题才会用到 R1?但是 V3 老是提示服务繁忙..

    8 条回复    2025-02-28 11:19:06 +08:00
    Mjhhh
        1
    Mjhhh  
       4 天前
    我让它写代码,R1 给出的代码质量会更高
    housex
        2
    housex  
       4 天前
    DeepSeek-V3
    通用型模型:专注于自然语言处理、知识问答、内容创作等通用任务,目标是实现高性能与低成本的平衡,适用于智能客服、个性化推荐系统等场景。
    训练重点:通过算法优化降低训练成本,采用多令牌预测( MTP )和无辅助损失负载均衡策略提升效率,支持 128K 上下文窗口。
    DeepSeek-R1
    推理专用模型:专为数学、代码生成和复杂逻辑推理任务设计,通过大规模强化学习( RL )提升推理能力,对标 OpenAI o1 系列。
    创新训练方法:完全摒弃监督微调( SFT ),采用纯强化学
    习(如 GRPO 算法)训练基座模型,并通过冷启动数据优化可读性。
    具体可以看下这篇: https://zhuanlan.zhihu.com/p/20240802247
    FireKey
        3
    FireKey  
       4 天前   ❤️ 2
    文科 V3 好,理科 R1 强
    hokori
        4
    hokori  
       4 天前
    DeepSeek-V3 专注于自然语言处理、知识问答、内容创作等通用任务
    DeepSeek-R1 推理专用模型,专为数学、代码生成和复杂逻辑推理任务设计

    大概是这种区分吧
    hafuhafu
        5
    hafuhafu  
       4 天前
    就结果而言肯定是 R1 强。
    但是肯定不是啥问题都丢 R1 问,太浪费时间了,简单问题也没啥必要。
    我反正是日常丢 V3 ,结果不满意/复杂问题再丢 R1 。其他厂商的模型同理。
    Tink
        6
    Tink  
       4 天前
    V3 写文章好,R1 推理好
    IvanLi127
        7
    IvanLi127  
       3 天前
    R1 很适合我这种话都说不清楚的人,他能硬生生地理解我的意思,能让我少打很多字。
    我一般容易说清楚的小问题找 v3 ,难描述的问题找 r1 。
    Sting1226
        8
    Sting1226  
       3 天前
    R1 ,它会尝试去「理解」你的问题。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5749 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 06:29 · PVG 14:29 · LAX 22:29 · JFK 01:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.