V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jack778
V2EX  ›  OpenAI

gpt4 越来越不行了

  •  
  •   jack778 · 238 天前 · 2685 次点击
    这是一个创建于 238 天前的主题,其中的信息可能已经有所发展或是发生改变。
    chatgpt 越来越垃圾了, 今天让他写个代码半天都写不出来, 一直卡住, 试过了多个会话都不新, 再这样下去要完, 用 Claude-3-Opus 立马就写出来了, 现在 gpt4 又卡又垃圾, plus 不想订阅了, 以后用 Claude-3-Opus 算了
    15 条回复    2024-04-29 19:11:23 +08:00
    FryFryFry
        1
    FryFryFry  
       237 天前
    我刚也发现 ChatGPT 变蠢了,问了一下它是什么版本,回答是 3.5 ,可明明选的是 4.0 。正纳闷儿的,也没有超过次数。你也可以试试问它版本
    silencil
        2
    silencil  
       237 天前
    用的 coze 调用的 没问题
    onionnews
        3
    onionnews  
       237 天前
    可以试试 command-r-plus ,很聪明。就是没测试过代码能力
    lizhisty
        4
    lizhisty  
       237 天前
    Claude-3-Opus 碾压 GPT4 并不是 4 用不了 才用 opus
    NBXX2018
        5
    NBXX2018  
       237 天前
    是调用代码解释器写到包含 < > 这两个字符的时候停住无法输出吗?
    这个 BUG 在开发者社区两天前就有人报障,一直没有处理,也没有标注故障发生。现在影响很恶劣。
    zhangzEric
        6
    zhangzEric  
       237 天前 via iPhone
    代码场景的话可以试试 devv ai ,平时工作中有部分代码生成是用它做的,个人体感可用性还不错,可以尝试下
    YouMoeYi
        7
    YouMoeYi  
       237 天前
    我也是 GPT4 转 Opus, 现在的 GPT-4 太垃圾了, 各方面体验 Claude Opus 真的更好
    drymonfidelia
        8
    drymonfidelia  
       237 天前
    @silencil coze 的 gpt4 是假的 “今天我有 3 个苹果,昨天吃了 1 个苹果,还剩几个?”这个问题 100%回答错,正版能答出来
    haitaoli
        9
    haitaoli  
       237 天前
    反正我用的 gpt3 最近很蠢,问它代码的问题,它把一段代码重复了三四遍
    ![]( https://imgur.com/LFgmP0P)
    yumizhao888
        10
    yumizhao888  
       237 天前 via iPhone
    确实变傻了,而且卡。主要现在不用注册都能用,资源都用在普及上了。
    silencil
        11
    silencil  
       237 天前
    @drymonfidelia 这我倒不知道诶,不过我一直用 coze 自建的 bot 来做代码维护,目前是我用的最顺手的一个。
    imydou
        12
    imydou  
       237 天前
    @drymonfidelia GPT-4 今天有 3 个苹果,昨天吃了 1 个苹果,那么剩下的苹果数量就是 3 - 1 = 2 个。
    taotaodaddy
        13
    taotaodaddy  
       237 天前
    COZE 说还剩 3 个苹果
    taotaodaddy
        14
    taotaodaddy  
       237 天前
    POE 的 GPT4 也说还剩 3 个苹果
    lchynn
        15
    lchynn  
       236 天前
    @drymonfidelia #4 ;

    用中文测试一下, 国内大模型能通过的只有 KIMICHAT, GLM 4, 文心一言, 其他国产大模型都翻车了。
    换成英语询问 :I have 3 apples today, I ate 1 apple yesterday, how many apples do I have left? 通义千问可以通过;

    国外模型, 能通过的只有 GPT4 , GPT4-TURBO ,LLAMA3-80B, CLAUDE3-OPUS, CLAUDE3-SONNET, MIXTRAL 7X8, GEMMA 7B ; PHI2-MINI

    国内开源模型只有 QWEN 70B ; DEEPSEEK-LM 33B
    其他全部翻车。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2696 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 07:49 · PVG 15:49 · LAX 23:49 · JFK 02:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.