V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Davy
V2EX  ›  Google

Bard (Gemini Pro)排名已升至第 2

  •  
  •   Davy · 280 天前 · 8088 次点击
    这是一个创建于 280 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Bard (Gemini Pro)的 elo 排名已升至第 2 ,仅次于 GTP-4-Turbo ,高于 GTP-4-0314 和 GTP-4-0613 。
    https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
    43 条回复    2024-01-29 13:58:13 +08:00
    disorientatefree
        1
    disorientatefree  
       280 天前
    Bard 用起来是不错,不过感觉 Google 应该挺省的

    日常感觉大多数问题都没进 LLM ,一瞬间就出结果了。。。 偶尔小众问题他可能没见过会慢一点才像是 LLM
    dnfQzjPBXtWmML
        2
    dnfQzjPBXtWmML  
       280 天前
    @disorientatefree 可能只是用的人少,所以每个人分到的算力多😂
    Canglin
        3
    Canglin  
       280 天前 via Android
    为啥我问点问题它都是会显示各种 csdn 链接或者图片
    takato
        4
    takato  
       280 天前
    之前用 Bard 的时候感觉 Bard 的错误率明显高于 ChatGPT 3.5 。
    注意我的感受有一定主观性。
    ViolaH
        5
    ViolaH  
       280 天前 via iPhone
    GPT 不是 GTP
    disorientatefree
        6
    disorientatefree  
       280 天前
    @dnfQzjPBXtWmML 是行为很像 cache ,问题打进去一瞬间就一大段
    cyio
        7
    cyio  
       280 天前
    懂的可以解读下这个评测依据,这个 bard votes 数据低,是不是数据相对不足
    icy37785
        8
    icy37785  
       280 天前 via iPhone   ❤️ 1
    只能说每个人的使用场景不同,这种排名不能代表实际体验。在我的使用场景下体验 gemini pro 甚至感觉不如 gpt3.5 。真的个体差异还挺大的。
    coffeesun
        9
    coffeesun  
       280 天前 via Android
    bard 我给常把它问死,chatgpt 较少
    Sosocould
        10
    Sosocould  
       280 天前 via Android
    gemini pro 非常菜,比如 gpt3.5 ,可能英文下稍好一定
    miyuki
        11
    miyuki  
       280 天前
    bard 经常问死+1 ,不如 chatgpt 3.5
    miyuki
        12
    miyuki  
       280 天前
    @miyuki 补充,相同的问题 chatgpt 3.5 能多少给出一些结果,bard 是完全拒绝回答
    s4d
        13
    s4d  
       280 天前
    bard 没有 iOS app 吗?
    ronman
        14
    ronman  
       280 天前 via iPhone
    但实际体验感觉很垃圾
    hcx0
        15
    hcx0  
       280 天前
    bard 只有企业版才是 Gemini Pro 啊,楼上这些点评的都是用企业版?
    hcx0
        16
    hcx0  
       280 天前
    甚至企业版都是少数企业试用
    Davy
        17
    Davy  
    OP
       280 天前
    @cyio Bard 是去年 12 月 6 日切换到 Gemini Pro 的,所以只有一个多月的数据。
    Davy
        18
    Davy  
    OP
       280 天前
    @hcx0 现在 Bard 都是 Gemini Pro 了
    Davy
        19
    Davy  
    OP
       280 天前
    @coffeesun 问死的时候可以叫他 take a deep breath, you can do that.
    houhaibushihai
        20
    houhaibushihai  
       280 天前
    就日常编程问题而言(就之前问 stackoverflow 的问题,后来改用 3.5 了,再后来试了 bard ,bard 给的结果还不如 3.5 ,当然我是用中文搜的,英文不知道),我的实际体验 bard 不如 3.5
    hanqian
        21
    hanqian  
       280 天前 via iPhone
    个人使用(英文对话提问)下来最多可以说略胜 gpt3.5 ,但肯定远逊于 gpt4
    coffeesun
        22
    coffeesun  
       280 天前
    @Davy #19 反正关于质疑宗教的问题他都不咋回答
    Dragonphy
        23
    Dragonphy  
       280 天前
    @takato 一样,不太行
    NoOneNoBody
        24
    NoOneNoBody  
       280 天前
    web 版,bard 不等于 Gemini Pro
    试试用中文和英文问一下它是什么模型,我这里中文回答是 bard ,英文回答是 Gemini Pro
    android app 版我没装
    mingtdlb
        25
    mingtdlb  
       280 天前
    感觉不如 gpt3.5 ,另外 3.5 和 4 我也用不出差别,都大差不差。3.5 不行的,4 也差不多。
    youmilk
        26
    youmilk  
       280 天前

    一派胡言
    alading11
        27
    alading11  
       280 天前
    bard 使用起来明显不如 gpt3.5 ,差的很多
    ronman
        28
    ronman  
       280 天前 via Android
    @youmilk 笑死 我刚去问他 直接回答:周树人没有打鲁迅。
    hotbaidu
        29
    hotbaidu  
       280 天前 via Android
    https://poe.com/Gemini-Pro
    在 poe 体验,算在其他额度
    aptupdate
        30
    aptupdate  
       280 天前 via iPhone
    用 Gemeni Pro 感受就是速度是真的快。
    GeekGao
        31
    GeekGao  
       280 天前
    我用 Gemeni Pro 和 Bard 上直接问这个问题,回答的不一样,发现 Gemeni Pro 是准确的。
    @youmilk
    disorientatefree
        32
    disorientatefree  
       279 天前
    @mingtdlb 是 4 越来越差了,才出的时候很惊艳。 Bard 也是越来越无视上下文

    个人体感是它们都在试图省钱
    justincnn
        33
    justincnn  
       279 天前
    @Davy 这个确认么?感觉 bard 还是蛮蠢的
    forgetandnew
        34
    forgetandnew  
       279 天前 via iPhone
    中文版 bard 就是一坨大便
    privateproxies
        35
    privateproxies  
       279 天前
    你们可以通过 chatgemini.net 感受一下...
    pendulum
        36
    pendulum  
       279 天前
    用中文提问 bard 应该不是 gemini pro ,除非用 API
    abersheeran
        37
    abersheeran  
       279 天前
    Gemini Pro 确实可以的,我为了方便用它,写了三个 BOT ,分别可以在 QQ 群、微信公众号和 Telegram 上用。开哪个方便就直接开了。
    cnbatch
        38
    cnbatch  
       279 天前
    Bard 同样也是一本正经地胡说八道,最终还不如自己搜索
    sud0day
        39
    sud0day  
       278 天前
    程序方面的问题,感觉还是 Claude 好用
    KorenKrita
        40
    KorenKrita  
       278 天前
    @privateproxies 非常难绷
    privateproxies
        41
    privateproxies  
       278 天前
    @KorenKrita 这 GEMINI PRO API....
    KorenKrita
        42
    KorenKrita  
       278 天前
    @privateproxies #41 所以说一本正经胡说八道啊 之前还有说自己是文心一言百度的来着我记得 就离谱
    kestrelBright
        43
    kestrelBright  
       278 天前
    不行啊,蓝牙耳机的问题都不会回答
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1097 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 19:29 · PVG 03:29 · LAX 12:29 · JFK 15:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.