r1mix: R1 思维链让普通 AI 更聪明 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

经常体验不同大模型的朋友都知道，deepseek r1 的思维链质量非常高，脑子非常聪明并且情商高，但在实际使用的时候：

指令遵循的能力较差，不能完全按照要求输出
写作辞藻非常华丽和刻意，写出的文字总能一眼 R1，阅读体验和沉浸感感都比较差

其他的普通模型，在指令遵循和写作文风上都有更优异的表现，但是脑子又弱一点。

根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力就可以达到 SOTA 级别的效果，而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

最近我们做了一个 r1mix 的模型混合的网站，可以让你用 deepseek-r1 去加持任意的模型，不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

常见的推荐组合是：

r1v3：新版 DeepSeek-V3 显著增强了代码能力和文学创作能力，在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
r1claude：Claude 系列模型的代码能力是当前的 No. 1 ，在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
r1grok：Grok-3 的文学创作能力是 Top 级别的，在加持 DeepSeek-R1 后故事的剧情会更加合理，表达也更富有层次感。
r1gemini：Gemini 2.0 系列知识面非常广泛、能力也很全面，在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

常见的模型都有，可以根据需求自己任意组合。也可以绑定你的 openrouter 账号，使用 openrouter 上的免费模型的时候我们不收费。

https://r1mix.ai

19 条回复 • 2025-04-02 16:01:29 +08:00

1

maximdx

26 天前

有意思，这种多个模型搭配使用的原理是什么？

2

faceair

OP

26 天前

2

@maximdx #1 先调用思考模型，获取到思维链以后停止请求，把思维链拼到原始请求里请求第二个模型

3

DigitaIOcean

26 天前

有趣，关注

4

xyfan

26 天前

LLM 的客户端 chatwise 好像也增加了类似的功能，调用一个模型的 thinking ，并应用于另一个模型

5

listenfree

26 天前

按你这样说，qwq32B+qwen2.5code 也是 SOTA 级别哟，就是不知道如何流程化试用

6

faceair

OP

26 天前

@listenfree #5 我们暂时没有 qwen2.5 code 模型的供应，你可以绑定你的 openrouter 账号，然后两个模型名用加号连接就可以调用了

7

iyaozhen

26 天前

我充值试了下，感觉还行。不过也没解决 R1 本身的幻觉问题，就是 R1 强是强，但是不太稳定

8

ovtfkw

26 天前 via iPhone

@faceair #2 就这？岂不是很简单

9

pakro888

26 天前

市场上早已经有人开发出来了：
1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)

10

rqYzyAced2NbD8fw

26 天前

@xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做，莫名其妙的垃圾功能做一堆，还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发

11

SkywalkerJi

25 天前 via Android

主楼说的模型特点是中文写作吗，还是说外文也一样。

12

Lee90

25 天前

邮箱登录好评

13

paopjian

25 天前

赛博换脑, r1 的思维脑接上 claude 的嘴

14

Seayon

25 天前

Cline 在写代码的时候也是先 PLAN 后 ACT ，我现在都用 deepseek-r1 去思考计划，然后切换到 claude 再去 ACT

15

anjingdexiaocai

25 天前 via Android

这就是 deepClaude 吧，很早就有了

16

hugowangnz

25 天前

@LanhuaMa 太对了，这么流行的功能不做，目前只能自己写函数支持思维链显示了

17

LinSP

25 天前

这不是变形版蒸馏

18

flcwk

24 天前

@faceair 对的，相当于用思考模型做规划，然后让实践能力强的模型进行操作，之前的 deepclaude 和 deepgemini 都是这个思路，进一步的可以引入多个思考模型进行专家会审，效果更佳

19

faceair

OP

24 天前

@flcwk #18 多思考模型的话算是 agent 的思路了，做 API 的话延迟太大了 token 数跟效果也成正比的话，用户不买账

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 1218 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 20ms · UTC 17:30 · PVG 01:30 · LAX 10:30 · JFK 13:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.