V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
TigerS
V2EX  ›  问与答

現在相對(最)好用的 AI 模型是哪個?

  •  
  •   TigerS · 11 天前 · 1228 次点击

    最近和朋友聊天說到了 ChatGPT 那個最貴的 o1 版本,官方售價一個月 200 美金。又聊到了 DS 的。因為我和朋友都沒用過 DS 的所以不好評價,我倒是用過一些其他的免費版本的,但基本都沒有體驗過付費。

    從朋友的描述,GPT 200 美金那個版本已經能作為一個研究生畢業的人的一個思維了,加上他數據中海量的知識點比普通任何一個人都全面,所以在實際使用上他基本能回答所有的問題。

    另外還有一個版本可以聯網使用以此增加更多最新的信息點。

    聽起來非常不錯,加上 DS 鋪天蓋地的文章說比 GPT 強大等等,突然有想試試付費版的衝動。

    現在想了解下現有的這麼多大模型裡面哪個是最好用的最全面的,或者說更出色一些?不考慮到價格,想買一兩個月試試水。

    平時需求基本在:

    • 充當搜索,替代谷歌
    • 幫助理順一些代碼邏輯,+ 幫助在需要調用庫的時候更快理清庫的 API endpoint
    • 在上手一些新的設備/軟件的時候能夠當成一個說明書使用(搜索的進階)
    • 解決一些深層的思考/數學難題,能提供解題思路,甚至能當老師來講解。
    • 私人助理式幫助解決各種問題(這個短期可能暫時沒有任何 AI 能夠實現)
    第 1 条附言  ·  9 天前
    有沒有哪個平台現在能支持 All in one 的?
    11 条回复    2025-02-16 10:31:28 +08:00
    mumbler
        1
    mumbler  
       11 天前
    gemini 是目前公开模型里面排名最高的,而且 aistudio.google.com 免费使用
    aliyaoming
        2
    aliyaoming  
       11 天前 via iPhone
    deepseek
    gaobh
        3
    gaobh  
       11 天前 via iPhone
    o1=ds r1
    yy306525121
        4
    yy306525121  
       11 天前 via iPhone
    ds 重在推理,claude 重在代码
    msg7086
        5
    msg7086  
       10 天前
    gemini flash 挺便宜。要高质量又不怕花钱的话可以上 claude 这些。
    yinmin
        6
    yinmin  
       9 天前 via iPhone
    deepseek 推理的确厉害,但是知识库还是比 chatgpt 差一些。有些 stem 知识 deepseek 不知道,再推理也推不出来。
    yinmin
        7
    yinmin  
       9 天前 via iPhone
    deepseek 有一个优点:用 gpt 多了,人的能力会退化;用 deepseek r1 仔细阅读推理过程,人的能力会提升。
    TigerS
        8
    TigerS  
    OP
       9 天前
    @gaobh 簡單看這兩個看似一樣但還是在一些地方有區別


    @yy306525121
    @msg7086
    如果考慮到推理,代碼等是不是 Claude 還更好一些?
    msg7086
        9
    msg7086  
       8 天前
    @TigerS Claude 质量普遍是更好的,cursor 默认就是用的 Sonnet ,唯一要担心的就是价格。
    Claude 3.5 Sonnet 是 3&15/M ,对比 Gemini 2.0 Flash Exp 是完全免费,就算用正价版的 Flash 也只有 0.1&0.4/M ,价格差距是 30 倍。要是要我自己掏钱,那我选便宜点的,顶多反复多问几次。
    TigerS
        10
    TigerS  
    OP
       8 天前
    @msg7086 和一個嘗試過 Claude 的朋友聊了聊,他現在主要還是用 GPT ,他說如果單純說寫代碼 Claude 的確強大一些,但是如果用到數學模型,解決複雜的數學問題等等,Claude 就和 GPT 差別大了。

    他說了個比喻,GPT 對於他的問題,各類複雜數學模型和數學問題,(他是做量化交易的所以對於數學模型需求非常大) GPT 就像一個數學專業(甚至全科)的研究生,甚至有的時候 GPT 還能反駁你的一些想法,最後證明 GPT 是對的。而 Claude 在寫代碼上是本科水平,但數學專業及思路等問題上最多是個高中水平。

    不知道這樣比較對不對。
    msg7086
        11
    msg7086  
       6 天前
    @TigerS 数学方面我就不清楚了。这种情况的话最好就是多个模型换着用。
    比如现在流行让 R1 专门负责思考,做一些规划上的东西,规划完了以后切到 sonnet 根据规划的文档去写实际代码。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2400 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 02:14 · PVG 10:14 · LAX 18:14 · JFK 21:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.