DeepSeek-R1 对标 OpenAI-o1 模型开源了

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

⚡ 性能媲美 OpenAI-o1

📖 完全开源的模型和技术报告

🏆 MIT 许可：可自由蒸馏、商业化！

X: https://x.com/deepseek_ai/status/1881318130334814301

Github: https://github.com/deepseek-ai/DeepSeek-R1

DeepSeek 太强了，再这样发展下去，感觉要成为开源大模型的扛把子了

第 1 条附言 · 1 小时 1 分钟前

HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-R1

DeepSeek-R1

OpenAI-o1

开源

41 条回复 • 2025-01-21 12:02:46 +08:00

LPJD

14 小时 35 分钟前

牛逼。现在也感觉很强，已经接近非常 4o 。就是偶尔会卡主一会。

AmoreLee

14 小时 30 分钟前 via iPhone

牛的，V3 已经挺好用的了，翻译，写代码都表现不错。

新的 R1 能力提升了，但价格也没有提高太多，大概是原来原价的两倍价格。

马上玩玩看🌚

ShaunSS

13 小时 31 分钟前

不知道 lite 版本在本地跑效果怎么样, deepseek 卷起来了啊

lthon

12 小时 25 分钟前

之前充 Claude 会员，一直没有体验 o1 ，现在好了，都不用了，这个春节属于 deepseek

jlkm2010

12 小时 21 分钟前

试了一下，挺强的

xpn282

10 小时 53 分钟前

小白问一下，这东西应该怎么玩？
我只会在 app 商店下载 app 版，没见什么收费项目。
正确的玩法是怎么玩？

AnoKKK

10 小时 51 分钟前

@xpn282 直接用官网的 chat 页面 https://chat.deepseek.com/ ，或者 api 调用 https://api-docs.deepseek.com/zh-cn/

xpn282

10 小时 47 分钟前

@AnoKKK 网页版和 app 版不一样吗？

lovestudykid

10 小时 45 分钟前

我觉得还是有差距，不过架不住便宜

alleluya

9 小时 39 分钟前 via Android

@AnoKKK 现在 cursor 用 deepseek v3 比 claude 如何?

fcoo

9 小时 3 分钟前

有人试过这个本地部署的话有没有屏蔽各种敏感词或者被特色化？
还是无论什么内容都不限制的可以随意生成呢？

explorerproxy

9 小时 1 分钟前

看了各种评价，主要是成本太可怕了

198plus

6 小时 35 分钟前 via Android

话说现在 deepseek 有图像这个模态的接口了吗

youthfire

3 小时 58 分钟前 via iPhone

目前是折扣价阶段吧，到 2 月中旬，价格应该是和 chat 模型是 44%的 4o 的价格，而 r1 模型是 88%的 4o 价格。毕竟 4o 是多模态，成本优势可能没有想象中那么大。

另外，如果不看分数，自己去跑一下带有大量数字的，同时需要 ocr 的又涉及略复杂计算处理，（比如退税表格）目前唯一接近满意的只有 claude-3.5-sonnet1022 。大多数连数字 ocr 这关都错误百出，整理过程中也逻辑各种不可靠。openai 的 o1 ，google studio 的 1226 ，deepseek 的深度，都完成不好。

如果是日常聊天和百科，确实够用，但可能 4o mini 和 claude 3.5 haiku 也够用，价格优势又没了。

jqtmviyu

3 小时 51 分钟前

千万别搞涨价并关闭 v3 的做法. 并不是所有场景都需要用到更好的模型.

guiyumin

3 小时 35 分钟前

https://github.com/deepseek-ai/DeepSeek-R1
这里面一行代码没有
开的什么源？

Greendays

3 小时 30 分钟前

@guiyumin 模型文件能下载就已经算开了。小开也是开

JustGoGoGO

3 小时 29 分钟前 via Android

@guiyumin https://huggingface.co/deepseek-ai/DeepSeek-R1

gpt5

3 小时 16 分钟前

很期待的用了一下，没有期待的那么 nb 啊。
在我没要求的情况下，强行给我写代码，即使我说用文字解释，它还是用代码🤦

redr41n

3 小时 12 分钟前

@guiyumin github 开源的是论文，模型在 HuggingFace

wangtian2020

3 小时 11 分钟前

加油，期待让我用上更好的 chatgpt

erxiao

3 小时 5 分钟前

@AnoKKK api 还没有放出来吧

neteroster

2 小时 56 分钟前 via Android

@youthfirr 在复杂问题上 4o 和 r1 已经不是一个层次的模型了，对比其价格几乎没有任何意义（如果不考虑思维链 r1 甚至还便宜）。另外 OCR 你完全可以拿 mathpix 或者 gemini flash exp 做个预处理（成文本）再给文本模型做，因为几乎所有多模态模型带图片进行推理时能力都会退化

9ki

2 小时 55 分钟前

感谢告知, 刚刚测试了下思考的过程也是用中文(用户语言)了, 之前思考过程一直用的英文

hongzhixiong

2 小时 48 分钟前

邮箱注册好难啊。只能手机号

Binwalker

2 小时 38 分钟前

这玩意儿本地离线部署大概需要什么性能的机器？

AlexHsu

2 小时 35 分钟前

试了一下这几天正好用每天的日报写年终总结感觉和 kimi 比还差点意思呢。。。

Aprdec

2 小时 28 分钟前

@Binwalker 几百 G 显存吧好像

Aprdec

2 小时 23 分钟前

@Aprdec 对不起,没看到提供了小参数模型

encro

1 小时 57 分钟前

只有我觉得就是一个弱智吗？

RoccoShi

1 小时 56 分钟前 via iPhone

之前官网一直能用的「深度思考」模型就是 deepseek r1 吧？现在是相当于把这个模型开源了？

Metatron7

1 小时 54 分钟前

@RoccoShi #31 之前是 R1-Lite ，现在是 R1 完整版

RoccoShi

1 小时 51 分钟前 via iPhone

@RoccoShi 搜了一下，好像之前是 r1-lite ，现在的官网版本应该也更新了，是说比原来响应速度快一些了

ala2008

1 小时 40 分钟前

试了下，只有 Google 的 gemini 答对了

realJamespond

1 小时 37 分钟前

强不强先来一把谁是人工智障辩论再说

czita

1 小时 20 分钟前

@xpn282 #6 用 ollama ，再结合一个前端 chat 交互就行，还能给别人用

aiqinxuancai

1 小时 17 分钟前

deepseek 的模型体感确实很强，不像是某些模型评测分高，实际用起来拉胯

newdongyuwei

1 小时 15 分钟前

我最近只用 DeepSeek 了，速度快，无限制。

yjd

55 分钟前

@newdongyuwei 我也在用，当搜索 2.0 挺好。反应快辅助写一些函数挺不错。其他不大行。chatgpt 用的人多有时候卡顿。目前就用这俩

wanniwa

45 分钟前

你们试的时 chat 吗，还是试的 api 调用

Hozoy

7 分钟前

引用一个媒体的文章：“论文展示了将 DeepSeek-R1 的推理能力蒸馏到较小的模型（如 Qwen 和 Llama 系列）上的显著效果。例如，DeepSeek-R1-Distill-Qwen-7B 在多个基准测试上超过了非推理模型 GPT-40-0513 ，而 14B 模型则全面超越了 QwQ-32B-Preview 。”