经常体验不同大模型的朋友都知道,deepseek r1 的思维链质量非常高,脑子非常聪明并且情商高,但在实际使用的时候:
其他的普通模型,在指令遵循和写作文风上都有更优异的表现,但是脑子又弱一点。
根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力 就可以达到 SOTA 级别的效果,而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。
我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。
最近我们做了一个 r1mix 的模型混合的网站,可以让你用 deepseek-r1 去加持任意的模型,不管是在写代码、写作其他各自通用任务上都有绝佳的表现。
常见的推荐组合是:
常见的模型都有,可以根据需求自己任意组合。也可以绑定你的 openrouter 账号,使用 openrouter 上的免费模型的时候我们不收费。
1
maximdx 5 天前
有意思,这种多个模型搭配使用的原理是什么?
|
![]() |
3
DigitaIOcean 5 天前
有趣,关注
|
![]() |
4
xyfan 5 天前
LLM 的客户端 chatwise 好像也增加了类似的功能,调用一个模型的 thinking ,并应用于另一个模型
|
5
listenfree 4 天前
按你这样说,qwq32B+qwen2.5code 也是 SOTA 级别哟,就是不知道如何流程化试用
|
![]() |
6
faceair OP @listenfree #5 我们暂时没有 qwen2.5 code 模型的供应,你可以绑定你的 openrouter 账号,然后两个模型名用加号连接就可以调用了
|
![]() |
7
iyaozhen 4 天前
|
9
pakro888 4 天前
市场上早已经有人开发出来了:
1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合) 2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源) |
![]() |
10
LanhuaMa 4 天前
@xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做,莫名其妙的垃圾功能做一堆,还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发
|
11
SkywalkerJi 4 天前 via Android
主楼说的模型特点是中文写作吗,还是说外文也一样。
|
![]() |
12
Lee90 4 天前
邮箱登录好评
|
13
paopjian 4 天前
赛博换脑, r1 的思维脑接上 claude 的嘴
|
![]() |
14
Seayon 4 天前
Cline 在写代码的时候也是先 PLAN 后 ACT ,我现在都用 deepseek-r1 去 思考计划,然后切换到 claude 再去 ACT
|
15
anjingdexiaocai 4 天前 via Android
这就是 deepClaude 吧,很早就有了
|
16
hugowangnz 4 天前
@LanhuaMa 太对了,这么流行的功能不做,目前只能自己写函数支持思维链显示了
|
17
LinSP 3 天前
这不是变形版蒸馏
|