⚡ 性能媲美 OpenAI-o1
📖 完全开源的模型和技术报告
🏆 MIT 许可:可自由蒸馏、商业化!
X: https://x.com/deepseek_ai/status/1881318130334814301
Github: https://github.com/deepseek-ai/DeepSeek-R1
DeepSeek 太强了,再这样发展下去,感觉要成为开源大模型的扛把子了
1
LPJD 14 小时 35 分钟前
牛逼。现在也感觉很强,已经接近非常 4o 。就是偶尔会卡主一会。
|
2
AmoreLee 14 小时 30 分钟前 via iPhone
牛的,V3 已经挺好用的了,翻译,写代码都表现不错。
新的 R1 能力提升了,但价格也没有提高太多,大概是原来原价的两倍价格。 马上玩玩看🌚 |
3
ShaunSS 13 小时 31 分钟前
不知道 lite 版本在本地跑效果怎么样, deepseek 卷起来了啊
|
4
lthon 12 小时 25 分钟前
之前充 Claude 会员,一直没有体验 o1 ,现在好了,都不用了,这个春节属于 deepseek
|
5
jlkm2010 12 小时 21 分钟前
试了一下,挺强的
|
6
xpn282 10 小时 53 分钟前
小白问一下,这东西应该怎么玩?
我只会在 app 商店下载 app 版,没见什么收费项目。 正确的玩法是怎么玩? |
7
AnoKKK 10 小时 51 分钟前
|
9
lovestudykid 10 小时 45 分钟前
我觉得还是有差距,不过架不住便宜
|
11
fcoo 9 小时 3 分钟前
有人试过这个本地部署的话有没有屏蔽各种敏感词或者被特色化?
还是无论什么内容都不限制的可以随意生成呢? |
12
explorerproxy 9 小时 1 分钟前
看了各种评价,主要是成本太可怕了
|
13
198plus 6 小时 35 分钟前 via Android
话说现在 deepseek 有图像这个模态的接口了吗
|
14
youthfire 3 小时 58 分钟前 via iPhone
目前是折扣价阶段吧,到 2 月中旬,价格应该是和 chat 模型是 44%的 4o 的价格,而 r1 模型是 88%的 4o 价格。毕竟 4o 是多模态,成本优势可能没有想象中那么大。
另外,如果不看分数,自己去跑一下带有大量数字的,同时需要 ocr 的又涉及略复杂计算处理,(比如退税表格)目前唯一接近满意的只有 claude-3.5-sonnet1022 。 大多数连数字 ocr 这关都错误百出,整理过程中也逻辑各种不可靠。openai 的 o1 ,google studio 的 1226 ,deepseek 的深度,都完成不好。 如果是日常聊天和百科,确实够用,但可能 4o mini 和 claude 3.5 haiku 也够用,价格优势又没了。 |
15
jqtmviyu 3 小时 51 分钟前
千万别搞涨价并关闭 v3 的做法. 并不是所有场景都需要用到更好的模型.
|
16
guiyumin 3 小时 35 分钟前
|
18
JustGoGoGO 3 小时 29 分钟前 via Android
|
19
gpt5 3 小时 16 分钟前
很期待的用了一下,没有期待的那么 nb 啊。
在我没要求的情况下,强行给我写代码,即使我说用文字解释,它还是用代码🤦 |
21
wangtian2020 3 小时 11 分钟前
加油,期待让我用上更好的 chatgpt
|
23
neteroster 2 小时 56 分钟前 via Android
@youthfirr 在复杂问题上 4o 和 r1 已经不是一个层次的模型了,对比其价格几乎没有任何意义(如果不考虑思维链 r1 甚至还便宜)。另外 OCR 你完全可以拿 mathpix 或者 gemini flash exp 做个预处理(成文本)再给文本模型做,因为几乎所有多模态模型带图片进行推理时能力都会退化
|
24
9ki 2 小时 55 分钟前
感谢告知, 刚刚测试了下思考的过程也是用中文(用户语言)了, 之前思考过程一直用的英文
|
25
hongzhixiong 2 小时 48 分钟前
邮箱注册好难啊。只能手机号
|
26
Binwalker 2 小时 38 分钟前
这玩意儿本地离线部署大概需要什么性能的机器?
|
27
AlexHsu 2 小时 35 分钟前
试了一下 这几天正好用每天的日报写年终总结 感觉和 kimi 比还差点意思呢。。。
|
30
encro 1 小时 57 分钟前
只有我觉得就是一个弱智吗?
|
31
RoccoShi 1 小时 56 分钟前 via iPhone
之前官网一直能用的「深度思考」模型就是 deepseek r1 吧?现在是相当于把这个模型开源了?
|
34
ala2008 1 小时 40 分钟前
试了下,只有 Google 的 gemini 答对了
|
35
realJamespond 1 小时 37 分钟前
强不强先来一把谁是人工智障辩论再说
|
37
aiqinxuancai 1 小时 17 分钟前
deepseek 的模型体感确实很强,不像是某些模型评测分高,实际用起来拉胯
|
38
newdongyuwei 1 小时 15 分钟前
我最近只用 DeepSeek 了,速度快,无限制。
|
39
yjd 55 分钟前
@newdongyuwei 我也在用,当搜索 2.0 挺好。反应快辅助写一些函数挺不错。其他不大行。chatgpt 用的人多有时候卡顿。目前就用这俩
|
40
wanniwa 45 分钟前
你们试的时 chat 吗,还是试的 api 调用
|
41
Hozoy 7 分钟前
引用一个媒体的文章:“论文展示了将 DeepSeek-R1 的推理能力蒸馏到较小的模型(如 Qwen 和 Llama 系列)上的显著效果。例如,DeepSeek-R1-Distill-Qwen-7B 在多个基准测试上超过了非推理模型 GPT-40-0513 ,而 14B 模型则全面超越了 QwQ-32B-Preview 。”
|