V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
leegoo
V2EX  ›  OpenAI

Claude 3.7 Sonnet 横空出世!混合推理暴击编程极限, AI 编码王者再次傲视群雄

  •  
  •   leegoo · 1 天前 · 9836 次点击

    全球首个混合推理模型 Claude 3.7 Sonnet 正式登场!

    Anthropic 祭出杀手锏,将即时响应与可扩展思考融为一体,彻底颠覆 AI 能力边界。 Anthropic 祭出杀手锏 更多信息查看推文: https://x.com/alexalbert__/status/1894093648121532546

    生态联动升级

    同步亮相的 cusor ( 0.46.3 ),

    已经接入 Claude 3.7 Sonnet;

    不知道白嫖用户可不可以使用 0.0

    更多信息查看推文: https://x.com/alexalbert__/status/1894093648121532546

    正式迈入“动嘴指挥”纪元?

    94 条回复    2025-02-26 20:38:20 +08:00
    mumbler
        1
    mumbler  
       1 天前   ❤️ 1
    刚刚看到 cursor 可选 3.7 了,实测编码能力肉眼可见的提升
    IDAEngine
        2
    IDAEngine  
       1 天前
    确实可以,编码能力秒杀绝大部分 IT 民工,公司又要裁人了 [😭]
    xubingok
        3
    xubingok  
       1 天前
    cursor 还是 0.45..检查更新超时..
    官网下载也是 0.45.
    crocoBaby
        4
    crocoBaby  
       1 天前   ❤️ 1
    编程已死
    frankies
        5
    frankies  
       1 天前
    虽然但是,这标题一眼百家号啊,营销号的味儿扑面而来😅
    flyespace
        6
    flyespace  
       1 天前
    官网还是 0.45 啊,升级后也是 0.45 呢,你的 0.63 是哪里来到呢
    letwewell
        7
    letwewell  
       1 天前
    傲视群雄,遥遥领先
    HFX3389
        8
    HFX3389  
       1 天前
    @xubingok #3
    @flyespace #6
    我更新升级之后是 0.46.3 (user setup)
    arer
        9
    arer  
       1 天前
    @flyespace 已经可以更新了
    Lemonadeccc
        10
    Lemonadeccc  
       1 天前
    还没试,打开 cursor 已经可选了
    SawyerGuo
        11
    SawyerGuo  
       1 天前
    GitHub Copilot 能上 3.7 吗
    greygoo
        12
    greygoo  
       1 天前
    可以价格不变,推一手 openrouter+aline.已经用上了
    Dlin
        13
    Dlin  
       1 天前
    64k extended thinking 的 agentic codeing 是个“-”是标识不支持么?
    magic3584
        14
    magic3584  
       1 天前
    @greygoo #12
    大佬是 Cline 吧?我用本地模型不太好用
    idblife
        15
    idblife  
       1 天前
    @flyespace
    已更新至 0.46.3 ,正在用实际问题测试中,初步感受确实 nb
    magic3584
        16
    magic3584  
       1 天前
    @HFX3389 #8
    user setup 是哪?
    我放开更新后,0.45.11 ,不过 cursor 确实可选 3.7 了
    greygoo
        17
    greygoo  
       1 天前
    @magic3584 是 Cline 打错了,我用的是 fork 版 Roo Code 非常好用加上 openrouter 的 sonnet 3.5,有点小贵,但是非常强
    greygoo
        18
    greygoo  
       1 天前
    @greygoo #12 打错了是 Cline
    magic3584
        19
    magic3584  
       1 天前
    @greygoo #17
    感谢大佬推荐。我目前还在白 piao cursor,费功夫但是省钱😂
    cxe2v
        20
    cxe2v  
       1 天前
    不用更新 cursor ,重启下直接看到 claude 3.7 的 model 了
    redbeanzzZ
        21
    redbeanzzZ  
       1 天前
    0.45 也能选 3.7 模型
    honjow
        22
    honjow  
       1 天前 via iPhone
    windsurf 啥时候支持🤔
    Stevenv
        23
    Stevenv  
       1 天前   ❤️ 1
    继续吹。
    aeron
        24
    aeron  
       1 天前
    @honjow 已经支持了,最新 1.3.6 版本已经提供 3.7 模型,但是我看下载界面还是 1.3.4 版本的
    LoLSilence
        25
    LoLSilence  
       1 天前
    @mumbler 实测了什么,肉眼可见的提升了,看看
    bitmin
        26
    bitmin  
       1 天前
    看了下 github copilot 也有 3.7 和 Thinking 了
    max1024
        27
    max1024  
       1 天前
    @aeron mac intel 的还没有看到
    mumbler
        28
    mumbler  
       1 天前   ❤️ 1
    @LoLSilence #25 上周项目卡了个 BUG ,很复杂,人不花个 1 个月根本理不清里面的关系,之前用 o3 mini,o1,claude 3.5,deepseek r1 都没解决,今早用 3.7 一次就解决了
    Lemonadeccc
        29
    Lemonadeccc  
       1 天前
    用 3.7 优化代码感觉没有 3.5 的实在,目前只测了这一个
    Comyn
        30
    Comyn  
       1 天前
    @bitmin 刚看了我的还没有
    SniperXu
        31
    SniperXu  
       1 天前
    @bitmin 不懂就问,thinking 和不带 thinking 的有啥区别
    xubingok
        32
    xubingok  
       1 天前
    @SniperXu #31 带 thinking 是具备推理的....不过实际上大部分日常代码用普通的就行了.
    DosLee
        33
    DosLee  
       1 天前
    sakeven
        34
    sakeven  
       1 天前
    测试了一下 3.7 。太喜欢调用工具了...很多问题都不需要调用工具的
    非常的激进
    ddmasato
        35
    ddmasato  
       1 天前
    vscode 已经同步跟进。。。。
    tonytonychopper
        36
    tonytonychopper  
       1 天前   ❤️ 15
    一大波文章即将来袭:《前端已死》、《代码已死》、《编程已死》、《 10 分钟我做了一个网站》、《一周用 cursor 做了 3 个 APP 》……
    letmatte
        37
    letmatte  
       1 天前
    3.7 配合 Cline 尚不支持 computer use 和 prompt caching 呀
    3.5 支持
    mywjyw
        38
    mywjyw  
       1 天前
    3.5 已经足够出色,这么快就有 3.7 更上一层楼,Anthropic 恐怖如斯
    HFX3389
        39
    HFX3389  
       1 天前   ❤️ 2
    @mumbler #28 想听听有多复杂然后 3.7 解决后豁然开朗的故事
    javalaw2010
        40
    javalaw2010  
       1 天前
    歪个楼,问下 github copilot 可以用 3.7 的小伙伴,你们是订阅了么,我免费计划一直看不到 3.7 ,官网上也说 3.7 对免费计划不可见。
    HFX3389
        41
    HFX3389  
       1 天前
    @magic3584 #16 我是今天早上右下角弹了个 Cursor Update ,更新完了就是 0.46.3 了
    Yeo0o
        42
    Yeo0o  
       1 天前
    真不错,copilot 也更新了。
    bitmin
        43
    bitmin  
       1 天前
    @javalaw2010 #40

    我是订阅了,在 vscode 上可以选到 3.7 ,JB 上不能
    mywjyw
        44
    mywjyw  
       1 天前
    我在 cursor composer 里用了一下 3.7 ,怎么感觉还变笨了呢...一个问题说了三四次解决的一坨
    dongzhuo777
        45
    dongzhuo777  
       1 天前   ❤️ 1
    @mumbler #28 能专门开个贴说说怎么理清的吗。现在这种 AI 编码工具可以辅助排查那种屎山项目吗 比如那种纯业务代码 跑了 10 年 20 年的 准备重构。缺少文档。几十万行 需要借助 AI 来梳理
    cluefly
        46
    cluefly  
       1 天前
    @Lemonadeccc 等试用结果吧
    infinityv
        47
    infinityv  
       1 天前 via iPhone
    这图看 grok3 才是整体最强的?
    lthero
        48
    lthero  
       1 天前
    @infinityv #47 是的
    LaTero
        49
    LaTero  
       1 天前
    确实挺强的,thinking 还没试,普通模式感觉应用数学有不少进步。不过我看他们的博客,好像最大的提升是为了各种 agent 工具、tool use 、AI IDE 做的,但是目前 AI 工具都是围绕在前端和 VS Code ,非前端可能提升不是很大,JetBrains 在 AI 方面实在是太令人失望了。
    mumbler
        50
    mumbler  
       1 天前
    @dongzhuo777 #45 说那么多不如你亲自试试,20 美金而已,用 cursor 打开项目目录,ctrl+i 修改或者增加功能即可,这个钱绝对是花得最值的
    AsuorZ
        51
    AsuorZ  
       1 天前
    @SawyerGuo 付费用户有
    boleyn1992
        52
    boleyn1992  
       1 天前   ❤️ 2
    已经更新 Claude 3.7 Sonnet ,可以体验 https://datapipe.app
    vipfts
        53
    vipfts  
       1 天前
    @Stevenv 遥遥领先, 遥遥领先啊
    vipfts
        54
    vipfts  
       1 天前
    @tonytonychopper 狼又来啦~
    zgxxx
        55
    zgxxx  
       1 天前
    cursor 里面试了一下 Claude 3.7 Sonnet ,它每次提供完代码后又继续:我发现可以提供更加完善的代码方案...根本停不下来
    dreamingclj
        56
    dreamingclj  
       1 天前
    @mumbler #1 3.7 还是 3.7 thinking ?
    magic3584
        57
    magic3584  
       1 天前
    @HFX3389 #41
    我日常都屏蔽 cursor 更新,今天是主动放开去自动更新的
    wangyzj
        58
    wangyzj  
       1 天前
    除了干代码这件事就没别的可以干的么?
    kw8023cn
        59
    kw8023cn  
       1 天前
    @frankies cursor 的软广,话说 cursor 的推广真疯狂,但是真有人会为了 iede 或者 vscode 插件搞定的事情,而放弃成熟的 IDEA 转投 cursor ?
    hanqian
        60
    hanqian  
       1 天前
    编码这一项非推理模型比其他家的推理模型还牛逼,真就是护城河了
    zhangeric
        61
    zhangeric  
       1 天前
    我觉得 deepseek 就搞用了.
    tyrantZhao
        62
    tyrantZhao  
       1 天前
    claude 封号不是很严重么?
    layxy
        63
    layxy  
       1 天前
    @kw8023cn 来回切很烦人,我一直用不习惯 vscode(基于 vscode 的编辑器看起来总感觉不太舒服),奈何 idea 的插件都太拉跨
    qwertyzzz
        64
    qwertyzzz  
       1 天前
    @kw8023cn 怎么了 我就是
    chesha1
        65
    chesha1  
       1 天前   ❤️ 1
    在 anthropic 官方的 workbench 里用 api 试了一下,写代码能力确实强,我有一个 ui 组件库的问题,之前只有 gpt-4o 和 o1-preview 能做出来( o3-mini, o1, R1 都不行),现在 claude 3.7 也能做出来了,而且做得最好

    其他普通的 cs 领域的问题,日常问题,没测出来明显优势,但是编程确实好

    测试记录: https://echoccc.online/posts/llm-test
    A555
        66
    A555  
       1 天前
    后端好用吗,重构屎山呢
    HXM
        67
    HXM  
       1 天前
    昨天在 cline 里让 sonnet 3.5 根据源码用 LaTeX TikZ 绘制示意图,给出的结果无法在 Overleaf 里正确编译,今天用一模一样的 prompt 让 3.7 试了一下,不仅能正确编译了还正确理解了代码逻辑。
    chesha1
        68
    chesha1  
       1 天前
    @dongzhuo777 #45 如果你说的重构是基于整个项目的,那现在任何 AI 都不行,上下文长度不够,模型底层限制在这里,不仅 cursor ,用什么工具都没用
    zorui
        69
    zorui  
       1 天前   ❤️ 1
    @kw8023cn 你自己去用用不就知道了, 被迫害妄想症?
    magic3584
        70
    magic3584  
       1 天前
    @greygoo #17
    请教大佬 Roo Code 跟 Cline 比有什么区别吗?
    murmur
        71
    murmur  
       1 天前
    @kw8023cn 那是因为 cursor 之前真就吊打其他家,现在 copilot 也支持 sonnet3.7 模型了,大家又站在同一条起跑线上了

    还有 cursor 有重构模式,会直接改代码,补充缺失的文件
    xingyue
        72
    xingyue  
       1 天前
    @HXM 巧了,我也是,昨天用 3.5 帮我改 bug ,改得一坨,今天 3.7 thinking 直接拿下.....真令人焦虑啊
    mumbler
        74
    mumbler  
       1 天前   ❤️ 4
    @kw8023cn #59 cursor 是编程的革命,不需要投广告,你还在意 IDE 说明你思想还在手写代码时代,AI 能自动写代码用什么 IDE 已经不重要了,你要不信,那就继续刀耕火种,等你都醒悟过来,已经在败者组了,就像李彦宏进了败者组,现在做什么百度都死路一条
    jianyestudy
        75
    jianyestudy  
       1 天前
    羡慕人民币玩家
    chesha1
        76
    chesha1  
       1 天前
    我订阅了,但是只能在 copilot chat 里用 claude 3.7 ,copilot 本体的 completions models 还是选不了 claude 3.7
    kkchan1999
        77
    kkchan1999  
       1 天前
    @SawyerGuo 上了
    yplam
        78
    yplam  
       1 天前
    @SawyerGuo vscode insider 版本测过可以,Agent 模式加上 Claude 3.7 效果很好
    zhw2590582
        79
    zhw2590582  
       1 天前
    @SawyerGuo 今天用上了
    xzylzz
        80
    xzylzz  
       1 天前
    昨天刚开会员,今天就有大更新,挺好
    HomeZane
        81
    HomeZane  
       1 天前
    你这标题,好奇怪呀
    c8c
        82
    c8c  
       1 天前
    你们是在个人的项目上使用这些模型吗? 在大的公司,应该都不允许使用这些外部模型吧? 担心泄露内部机密?
    encro
        83
    encro  
       1 天前
    trae 怎么还没更新呢
    leegoo
        84
    leegoo  
    OP
       1 天前
    @encro 这个是字节的把,怎么说字节是国内的公司,那么引入一个新的东西最起码也要内部审查(比如有没有需要和谐的东西)
    alphagao
        85
    alphagao  
       1 天前
    我是白嫖用户,可以用
    Scarb
        86
    Scarb  
       1 天前
    @aeron windsufr 怎么下载 1.3.6 呢,编辑器里检查更新,显示已经是最新了。现在是 1.3.4 版本
    rjagge
        87
    rjagge  
       1 天前
    3.7 在 curosor 上已经使用, 目前的感觉是比 3.5 更能听懂人话了, 而且给的代码建议也非常的克制. 以前 3.5 动不动就想给你把项目一整个优化, 添加一大堆不需要的功能, 现在做 debug, 给的建议非常清爽.
    aeron
        88
    aeron  
       1 天前
    @Scarb 我也没找到下载地址,上午看更新日志里面已经有 1.3.6 了,但是没提供下载地址。刚去翻了下,更新日志里 1.3.6 也没了
    make1money
        89
    make1money  
       1 天前
    @chesha1 连自家的 gpt 都只能 4o ( preview ),别说 claude 了
    lovestudykid
        90
    lovestudykid  
       18 小时 50 分钟前
    @infinityv 用下来才知道谁强,对 coding 来说 claude 绝对第一,R1 稍微落后
    daimaosix
        91
    daimaosix  
       14 小时 41 分钟前
    Claude 卧槽🐂🍺已经用上了
    leegoo
        92
    leegoo  
    OP
       13 小时 40 分钟前
    @daimaosix 兄弟你知道的太慢了 ~.~
    nickyadance23
        93
    nickyadance23  
       13 小时 29 分钟前
    @layxy #63 插件做不到和编辑器的深度集成,jetbrains 有自己家的 AI 产品 jetbrains AI ,试用了下跟 cursor 体验还是差挺多的。我也是不习惯 vscode ,现在用 copliot+claude 3.5 ,效果其实还可以,就是不能插入代码稍微麻烦点
    greygoo
        94
    greygoo  
       3 小时 26 分钟前
    @magic3584 #70 功能好像多一点 ui 我更喜欢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2354 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 16:04 · PVG 00:04 · LAX 08:04 · JFK 11:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.