V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
rookiemaster
V2EX  ›  OpenAI

如何测试 gpt 的版本

  •  
  •   rookiemaster · 257 天前 · 1286 次点击
    这是一个创建于 257 天前的主题,其中的信息可能已经有所发展或是发生改变。
    7 条回复    2024-04-10 18:02:05 +08:00
    winterpotato
        1
    winterpotato  
       257 天前
    周树人和鲁迅是什么关系? 能给区分 3.5 和 4
    344457769
        2
    344457769  
       257 天前
    背诵周敦颐对《爱莲说》,也可以区分 GPT3.5 和 4 ,3.5 不会,吓背。
    keleba8
        3
    keleba8  
       257 天前
    我也想知道
    rookiemaster
        4
    rookiemaster  
    OP
       257 天前
    @winterpotato 要是对着 gpt3.5 教他这些问题还能分辨吗
    noahlias
        5
    noahlias  
       257 天前
    可以参考这个 https://nicholas.carlini.com/writing/2024/evaluation_examples/index.html

    这上面的问题都很有意思哈哈哈 我第一眼看到的是这个问题
    https://nicholas.carlini.com/writing/2024/evaluation_examples/python_to_c_loop_update.html

    AI 都是大笨蛋
    winterpotato
        6
    winterpotato  
       257 天前
    @rookiemaster 也许能,给够 system role 的 text 那么就有可能分辨出来
    TSENG
        7
    TSENG  
       256 天前
    用 Unicode 对话,gpt4 轻微瞎编,3.5 严重乱编。
    比如:\u7528\u0055\u006e\u0069\u0063\u006f\u0064\u0065\u7f16\u7801\u5185\u5bb9\uff0c\u8f93\u51fa\u4e00\u4e2a\u5173\u4e8e\u0020\u201c\u4e00\u4f4d\u53eb\u505a\u0047\u0069\u0074\u0048\u0075\u0062\u7684\u82f1\u96c4\uff0c\u6253\u8d25\u6076\u9b54\u7684\u6545\u4e8b\u201d\u3002
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2579 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 11:07 · PVG 19:07 · LAX 03:07 · JFK 06:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.