V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
fu82581983
V2EX  ›  程序员

DeepSeek-R1 对标 OpenAI-o1 模型开源了

  •  5
     
  •   fu82581983 · 14 小时 56 分钟前 · 3723 次点击

    ⚡ 性能媲美 OpenAI-o1

    📖 完全开源的模型和技术报告

    🏆 MIT 许可:可自由蒸馏、商业化!

    X: https://x.com/deepseek_ai/status/1881318130334814301

    Github: https://github.com/deepseek-ai/DeepSeek-R1

    DeepSeek 太强了,再这样发展下去,感觉要成为开源大模型的扛把子了

    第 1 条附言  ·  1 小时 1 分钟前
    41 条回复    2025-01-21 12:02:46 +08:00
    LPJD
        1
    LPJD  
       14 小时 35 分钟前
    牛逼。现在也感觉很强,已经接近非常 4o 。就是偶尔会卡主一会。
    AmoreLee
        2
    AmoreLee  
       14 小时 30 分钟前 via iPhone
    牛的,V3 已经挺好用的了,翻译,写代码都表现不错。

    新的 R1 能力提升了,但价格也没有提高太多,大概是原来原价的两倍价格。

    马上玩玩看🌚
    ShaunSS
        3
    ShaunSS  
       13 小时 31 分钟前
    不知道 lite 版本在本地跑效果怎么样, deepseek 卷起来了啊
    lthon
        4
    lthon  
       12 小时 25 分钟前
    之前充 Claude 会员,一直没有体验 o1 ,现在好了,都不用了,这个春节属于 deepseek
    jlkm2010
        5
    jlkm2010  
       12 小时 21 分钟前
    试了一下,挺强的
    xpn282
        6
    xpn282  
       10 小时 53 分钟前
    小白问一下,这东西应该怎么玩?
    我只会在 app 商店下载 app 版,没见什么收费项目。
    正确的玩法是怎么玩?
    AnoKKK
        7
    AnoKKK  
       10 小时 51 分钟前
    @xpn282 直接用官网的 chat 页面 https://chat.deepseek.com/ , 或者 api 调用 https://api-docs.deepseek.com/zh-cn/
    xpn282
        8
    xpn282  
       10 小时 47 分钟前
    @AnoKKK 网页版和 app 版不一样吗?
    lovestudykid
        9
    lovestudykid  
       10 小时 45 分钟前
    我觉得还是有差距,不过架不住便宜
    alleluya
        10
    alleluya  
       9 小时 39 分钟前 via Android
    @AnoKKK 现在 cursor 用 deepseek v3 比 claude 如何?
    fcoo
        11
    fcoo  
       9 小时 3 分钟前
    有人试过这个本地部署的话有没有屏蔽各种敏感词或者被特色化?
    还是无论什么内容都不限制的可以随意生成呢?
    explorerproxy
        12
    explorerproxy  
       9 小时 1 分钟前
    看了各种评价,主要是成本太可怕了
    198plus
        13
    198plus  
       6 小时 35 分钟前 via Android
    话说现在 deepseek 有图像这个模态的接口了吗
    youthfire
        14
    youthfire  
       3 小时 58 分钟前 via iPhone
    目前是折扣价阶段吧,到 2 月中旬,价格应该是和 chat 模型是 44%的 4o 的价格,而 r1 模型是 88%的 4o 价格。毕竟 4o 是多模态,成本优势可能没有想象中那么大。

    另外,如果不看分数,自己去跑一下带有大量数字的,同时需要 ocr 的又涉及略复杂计算处理,(比如退税表格)目前唯一接近满意的只有 claude-3.5-sonnet1022 。 大多数连数字 ocr 这关都错误百出,整理过程中也逻辑各种不可靠。openai 的 o1 ,google studio 的 1226 ,deepseek 的深度,都完成不好。

    如果是日常聊天和百科,确实够用,但可能 4o mini 和 claude 3.5 haiku 也够用,价格优势又没了。
    jqtmviyu
        15
    jqtmviyu  
       3 小时 51 分钟前
    千万别搞涨价并关闭 v3 的做法. 并不是所有场景都需要用到更好的模型.
    guiyumin
        16
    guiyumin  
       3 小时 35 分钟前
    https://github.com/deepseek-ai/DeepSeek-R1
    这里面一行代码没有
    开的什么源?
    Greendays
        17
    Greendays  
       3 小时 30 分钟前
    @guiyumin 模型文件能下载就已经算开了。小开也是开
    JustGoGoGO
        18
    JustGoGoGO  
       3 小时 29 分钟前 via Android
    gpt5
        19
    gpt5  
       3 小时 16 分钟前
    很期待的用了一下,没有期待的那么 nb 啊。
    在我没要求的情况下,强行给我写代码,即使我说用文字解释,它还是用代码🤦
    redr41n
        20
    redr41n  
       3 小时 12 分钟前
    @guiyumin github 开源的是论文,模型在 HuggingFace
    wangtian2020
        21
    wangtian2020  
       3 小时 11 分钟前
    加油,期待让我用上更好的 chatgpt
    erxiao
        22
    erxiao  
       3 小时 5 分钟前
    @AnoKKK api 还没有放出来吧
    neteroster
        23
    neteroster  
       2 小时 56 分钟前 via Android
    @youthfirr 在复杂问题上 4o 和 r1 已经不是一个层次的模型了,对比其价格几乎没有任何意义(如果不考虑思维链 r1 甚至还便宜)。另外 OCR 你完全可以拿 mathpix 或者 gemini flash exp 做个预处理(成文本)再给文本模型做,因为几乎所有多模态模型带图片进行推理时能力都会退化
    9ki
        24
    9ki  
       2 小时 55 分钟前
    感谢告知, 刚刚测试了下思考的过程也是用中文(用户语言)了, 之前思考过程一直用的英文
    hongzhixiong
        25
    hongzhixiong  
       2 小时 48 分钟前
    邮箱注册好难啊。只能手机号
    Binwalker
        26
    Binwalker  
       2 小时 38 分钟前
    这玩意儿本地离线部署大概需要什么性能的机器?
    AlexHsu
        27
    AlexHsu  
       2 小时 35 分钟前
    试了一下 这几天正好用每天的日报写年终总结 感觉和 kimi 比还差点意思呢。。。
    Aprdec
        28
    Aprdec  
       2 小时 28 分钟前
    @Binwalker 几百 G 显存吧好像
    Aprdec
        29
    Aprdec  
       2 小时 23 分钟前
    @Aprdec 对不起,没看到提供了小参数模型
    encro
        30
    encro  
       1 小时 57 分钟前
    只有我觉得就是一个弱智吗?
    RoccoShi
        31
    RoccoShi  
       1 小时 56 分钟前 via iPhone
    之前官网一直能用的「深度思考」模型就是 deepseek r1 吧?现在是相当于把这个模型开源了?
    Metatron7
        32
    Metatron7  
       1 小时 54 分钟前   ❤️ 1
    @RoccoShi #31 之前是 R1-Lite ,现在是 R1 完整版
    RoccoShi
        33
    RoccoShi  
       1 小时 51 分钟前 via iPhone
    @RoccoShi 搜了一下,好像之前是 r1-lite ,现在的官网版本应该也更新了,是说比原来响应速度快一些了
    ala2008
        34
    ala2008  
       1 小时 40 分钟前
    试了下,只有 Google 的 gemini 答对了
    realJamespond
        35
    realJamespond  
       1 小时 37 分钟前
    强不强先来一把谁是人工智障辩论再说
    czita
        36
    czita  
       1 小时 20 分钟前
    @xpn282 #6 用 ollama ,再结合一个前端 chat 交互就行,还能给别人用
    aiqinxuancai
        37
    aiqinxuancai  
       1 小时 17 分钟前
    deepseek 的模型体感确实很强,不像是某些模型评测分高,实际用起来拉胯
    newdongyuwei
        38
    newdongyuwei  
       1 小时 15 分钟前
    我最近只用 DeepSeek 了,速度快,无限制。
    yjd
        39
    yjd  
       55 分钟前
    @newdongyuwei 我也在用,当搜索 2.0 挺好。反应快辅助写一些函数挺不错。其他不大行。chatgpt 用的人多有时候卡顿。目前就用这俩
    wanniwa
        40
    wanniwa  
       45 分钟前
    你们试的时 chat 吗,还是试的 api 调用
    Hozoy
        41
    Hozoy  
       7 分钟前
    引用一个媒体的文章:“论文展示了将 DeepSeek-R1 的推理能力蒸馏到较小的模型(如 Qwen 和 Llama 系列)上的显著效果。例如,DeepSeek-R1-Distill-Qwen-7B 在多个基准测试上超过了非推理模型 GPT-40-0513 ,而 14B 模型则全面超越了 QwQ-32B-Preview 。”
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4097 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 04:10 · PVG 12:10 · LAX 20:10 · JFK 23:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.