V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
faceair
V2EX  ›  分享创造

r1mix: R1 思维链让普通 AI 更聪明

  •  6
     
  •   faceair ·
    faceair · 5 天前 · 4382 次点击

    经常体验不同大模型的朋友都知道,deepseek r1 的思维链质量非常高,脑子非常聪明并且情商高,但在实际使用的时候:

    1. 指令遵循的能力较差,不能完全按照要求输出
    2. 写作辞藻非常华丽和刻意,写出的文字总能一眼 R1,阅读体验和沉浸感感都比较差

    其他的普通模型,在指令遵循和写作文风上都有更优异的表现,但是脑子又弱一点。

    根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力 就可以达到 SOTA 级别的效果,而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

    我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

    最近我们做了一个 r1mix 的模型混合的网站,可以让你用 deepseek-r1 去加持任意的模型,不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

    常见的推荐组合是:

    1. r1v3:新版 DeepSeek-V3 显著增强了代码能力和文学创作能力,在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
    2. r1claude:Claude 系列模型的代码能力是当前的 No. 1 ,在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
    3. r1grok:Grok-3 的文学创作能力是 Top 级别的,在加持 DeepSeek-R1 后故事的剧情会更加合理,表达也更富有层次感。
    4. r1gemini:Gemini 2.0 系列知识面非常广泛、能力也很全面,在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

    常见的模型都有,可以根据需求自己任意组合。也可以绑定你的 openrouter 账号,使用 openrouter 上的免费模型的时候我们不收费。

    https://r1mix.ai

    19 条回复    2025-04-02 16:01:29 +08:00
    maximdx
        1
    maximdx  
       5 天前
    有意思,这种多个模型搭配使用的原理是什么?
    faceair
        2
    faceair  
    OP
       5 天前   ❤️ 2
    @maximdx #1 先调用思考模型,获取到思维链以后停止请求,把思维链拼到原始请求里请求第二个模型
    DigitaIOcean
        3
    DigitaIOcean  
       5 天前
    有趣,关注
    xyfan
        4
    xyfan  
       5 天前
    LLM 的客户端 chatwise 好像也增加了类似的功能,调用一个模型的 thinking ,并应用于另一个模型
    listenfree
        5
    listenfree  
       4 天前
    按你这样说,qwq32B+qwen2.5code 也是 SOTA 级别哟,就是不知道如何流程化试用
    faceair
        6
    faceair  
    OP
       4 天前
    @listenfree #5 我们暂时没有 qwen2.5 code 模型的供应,你可以绑定你的 openrouter 账号,然后两个模型名用加号连接就可以调用了
    iyaozhen
        7
    iyaozhen  
       4 天前
    我充值试了下,感觉还行。不过也没解决 R1 本身的幻觉问题,就是 R1 强是强,但是不太稳定
    ovtfkw
        8
    ovtfkw  
       4 天前 via iPhone
    @faceair #2 就这?岂不是很简单
    pakro888
        9
    pakro888  
       4 天前
    市场上早已经有人开发出来了:
    1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
    2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)
    LanhuaMa
        10
    LanhuaMa  
       4 天前
    @xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做,莫名其妙的垃圾功能做一堆,还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发
    SkywalkerJi
        11
    SkywalkerJi  
       4 天前 via Android
    主楼说的模型特点是中文写作吗,还是说外文也一样。
    Lee90
        12
    Lee90  
       4 天前
    邮箱登录好评
    paopjian
        13
    paopjian  
       4 天前
    赛博换脑, r1 的思维脑接上 claude 的嘴
    Seayon
        14
    Seayon  
       4 天前
    Cline 在写代码的时候也是先 PLAN 后 ACT ,我现在都用 deepseek-r1 去 思考计划,然后切换到 claude 再去 ACT
    anjingdexiaocai
        15
    anjingdexiaocai  
       4 天前 via Android
    这就是 deepClaude 吧,很早就有了
    hugowangnz
        16
    hugowangnz  
       4 天前
    @LanhuaMa 太对了,这么流行的功能不做,目前只能自己写函数支持思维链显示了
    LinSP
        17
    LinSP  
       3 天前
    这不是变形版蒸馏
    flcwk
        18
    flcwk  
       3 天前
    @faceair 对的,相当于用思考模型做规划,然后让实践能力强的模型进行操作,之前的 deepclaude 和 deepgemini 都是这个思路,进一步的可以引入多个思考模型进行专家会审,效果更佳
    faceair
        19
    faceair  
    OP
       3 天前
    @flcwk #18 多思考模型的话算是 agent 的思路了,做 API 的话延迟太大了 token 数跟效果也成正比的话,用户不买账
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2420 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 09:27 · PVG 17:27 · LAX 02:27 · JFK 05:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.