V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ddddd0
V2EX  ›  OpenAI

openai 上线了 o3-mini

  •  
  •   ddddd0 · 22 小时 48 分钟前 · 2814 次点击
    27 条回复    2025-02-02 00:57:19 +08:00
    Vneix
        1
    Vneix  
       22 小时 20 分钟前 via Android   ❤️ 1
    看了下,免费用户点击输入框的 reason 后也能体验到。

    这是对 deepseek 的反击吗?
    ovtfkw
        2
    ovtfkw  
       21 小时 34 分钟前 via iPhone
    o3minihigh 强于现在的 o1 吗
    zaizaizai2333
        3
    zaizaizai2333  
       21 小时 31 分钟前
    mini 肯定是小模型喽,还是免费 R1 香

    o3mini (high) 看上去和 o1 水平差不多。
    zaizaizai2333
        4
    zaizaizai2333  
       21 小时 24 分钟前   ❤️ 1
    尽量不给 openAI 提供训练数据。

    它发展得再好也不愿意开源一点点模型,哪怕是去年的稍微过时的模型,只进不出的巨兽太贪婪了,还时不时搞小动作降智。太葛朗台了。
    fcoo
        5
    fcoo  
       21 小时 24 分钟前   ❤️ 5
    要不是 deepseek 还不知道什么时候给上线新模型,一直压箱底,慢慢的放,也开始学老黄刀法了。
    竞争对用户最好的,希望以后有更多更强开源模型出现
    zaizaizai2333
        6
    zaizaizai2333  
       21 小时 7 分钟前
    As part of this upgrade, we’re tripling the rate limit for Plus and Team users from 50 messages per day with o1-mini to 150 messages per day with o3-mini.

    一天 150 条 messages 限制。一个小模型还对订阅用户限制这么多。葛朗台+夏洛克😂
    randychoi
        7
    randychoi  
       19 小时 30 分钟前 via Android
    @ovtfkw 根据 livebeach 的数据, o1 综合能力最强,翻译能力 o3 mini high 不如 4o 。编程能力 o1 mini high 最强
    dji38838c
        8
    dji38838c  
       19 小时 7 分钟前   ❤️ 1
    @randychoi livebench 吧?
    lnmxy
        9
    lnmxy  
       18 小时 25 分钟前
    closeai:葛朗台+夏洛克
    7LM4liVHIyzvtMyO
        10
    7LM4liVHIyzvtMyO  
       18 小时 19 分钟前
    @dji38838c 为什么我看 openai 自己发的那篇报告中是 o3 mini 的数学能力最强了.https://openai.com/index/openai-o3-mini/
    xbox360
        11
    xbox360  
       17 小时 25 分钟前
    #10
    @466162659

    我是免费用户用的是 o3-mini,开启了推理.





    3.11 和 3.9 哪个大?



    ChatGPT

    我在比较 3.11 和 3.9 的大小时,3.11 略大。这个差距可能是微不足道的,但显示了微调的重要性。

    比较两个数

    让我看看,3.11 和 3.9 哪个大。显然,3.11 明显大于 3.9 ,很容易比较出哪个数更大。

    3.11 比 3.9 大。
    hallostr
        12
    hallostr  
       17 小时 25 分钟前
    感谢 deepseek ~
    lyanforever
        13
    lyanforever  
       15 小时 45 分钟前
    感谢 deepseek ,以后能用上更便宜的 chatgpt
    FightPig
        14
    FightPig  
       14 小时 52 分钟前
    openai: 其实我早就做了,只是被友商捷足先登了
    randychoi
        15
    randychoi  
       12 小时 12 分钟前 via Android
    @xbox360 @7LM4liVHIyzvtMyO 根据 livebench 的数据,o1 数学是最强的,其次是 deepseek r1 ,排第三是 o3 mini high
    randychoi
        16
    randychoi  
       12 小时 11 分钟前 via Android
    o3 min high:
    @xbox360 比较这两个数时,我们可以先看整数部分:

    3.11 的整数部分是 3

    3.9 的整数部分也是 3


    由于整数部分相同,我们再比较小数部分。

    3.11 的小数部分是 0.11

    3.9 的小数部分是 0.9 ,可以写成 0.90


    显然,0.90 > 0.11 ,所以 3.9 大于 3.11 。
    Kisesy
        17
    Kisesy  
       11 小时 44 分钟前
    @randychoi 好奇这类把 0.9 写为 0.90 再比较的 AI ,遇到:"3.111 和 3.9 哪个大?" 会怎么比较
    Kisesy
        18
    Kisesy  
       11 小时 42 分钟前
    哦,也许又会把 3.9 写成 3.900 吧
    YsHaNg
        19
    YsHaNg  
       9 小时 12 分钟前 via iPhone
    @Kisesy pi 和 3.9 哪个大🤣
    bccah
        20
    bccah  
       9 小时 0 分钟前 via Android
    @FightPig 什么地方先等了?
    Censhuang
        21
    Censhuang  
       8 小时 7 分钟前
    问:纯数字含义,3.11 与 3.9 哪个大
    比较数字大小
    我正在比较数字 3.11 和 3.9

    评估数字的大小
    3.11 比 3.9 大。这一点是有结论的。

    3.11 大于 3.9 。因为从数字的角度来看,3.11 比 3.9 大,尽管它们都以 3 开头,但 11 比 9 更大。
    chesha1
        22
    chesha1  
       4 小时 52 分钟前
    @ovtfkw #2 我丢了几个常用的问题(主要是 cs 相关的问题)给 poe 上的 o3-mini-high ,比 o1-preview 都差远了
    JoeDH
        23
    JoeDH  
       3 小时 59 分钟前
    还是 ds 用的爽
    Cbdy
        24
    Cbdy  
       3 小时 39 分钟前
    ds 给的压力不小啊
    randychoi
        25
    randychoi  
       3 小时 29 分钟前 via iPhone
    问:ChatGPT, 如何看待 deepseek ?

    o3 mini high: “从报道中可以看出,DeepSeek 的出现代表了中国在人工智能领域取得了不容忽视的进展,并对长期以来由美国主导的 AI 生态构成了挑战。以下几点是常见的看法:
    1. 技术进步与成本优势
    DeepSeek 的新模型在推理能力上取得了突破,同时在研发成本和计算资源消耗上比一些美国顶级模型更为经济,这表明中国在利用有限资源实现高性能 AI 方面具有一定优势。
    2. 全球竞争格局的变化
    这一进展不仅仅是技术上的突破,更反映了中美在科技领域的竞争正在加剧。DeepSeek 的出现促使全球重新审视人工智能的研发模式和投资逻辑,说明未来 AI 领域将会有更多竞争者涌现,市场格局可能发生深刻变化。
    3. 争议与挑战
    同时,关于 DeepSeek 的争议也不少:例如是否在研发过程中借鉴或“借用了”美国已有技术、是否真正具备原创性,以及由于政治和监管等原因在某些话题上的自我审查问题。这些争议不仅涉及技术本身,也关系到知识产权保护、国际贸易和技术伦理等更广泛的问题。
    4. 长远影响尚需观察
    尽管 DeepSeek 显示出一定的技术实力,但它是否能在长期内引领行业,或只是一次赶超尝试,还需要市场和时间来检验。毕竟,成功的 AI 生态系统不仅仅依靠模型本身的性能,还涉及到应用、数据、生态圈构建以及用户体验等多个层面。

    总体来说,DeepSeek 可以被看作是中国在全球 AI 竞争中迈出的重要一步,它既展示了潜在的技术实力,也提醒我们未来技术竞争中会面临更多复杂而多元的挑战。”

    o1: “从公开信息和媒体报道来看,DeepSeek 的出现确实在技术界和投资界引发了极大关注。以下是我对 DeepSeek 的一些观察与思考:

    1. **技术实力与创新性**
    - DeepSeek 在“推理”方面的进展,表明它并非仅仅是追随者,在某些技术环节上还有自己的突破。它能在有限的计算资源和相对低的成本下,训练出与一些领先模型性能相当的系统,这一点值得业界关注。
    - 不过,仍有分析认为 DeepSeek 的核心技术和方法在一定程度上借鉴或复用现有的大模型成果,尚未展现出全新的颠覆性创新。同时,有关它是否未经授权使用他人模型或数据的调查也在进行中,如果属实,则会影响其声誉与后续发展。

    2. **芯片和算力的制约**
    - 美国对中国的高端芯片出口管制,原本旨在限制中国在人工智能领域的快速追赶。但 DeepSeek 的出现,说明企业也会通过各种方式(包括改进算法、寻求替代硬件或绕过渠道)来降低对顶尖芯片的依赖。
    - 这给美国和其他国家的芯片与云服务供应商带来新的思考:如果中国在算法层面大幅提升效率,那么对昂贵 GPU 或高端芯片的需求量是否会受到影响,仍需在后续观察。

    3. **商业与市场影响**
    - DeepSeek 的新模型发布后,一些投资者担忧可能导致对昂贵 AI 芯片需求的下降,进而让英伟达等公司股价出现剧烈波动。但也有“杰文斯悖论”的观点,认为当训练和应用成本下降后,AI 可能会被广泛应用,最终反而推动更多芯片采购。
    - 不管怎样,DeepSeek 让市场看到了“中国 AI 追赶速度”超出预期,刺激了全球对 AI 竞争格局的新一轮讨论。

    4. **审查与自由度**
    - 有证据显示,DeepSeek 的对话模型会对中国政府视为敏感的话题进行审查,自我审查或拒绝回答。技术上的进步不一定意味着在信息层面有更大的自由或开放。如果在全球范围内推广,内容审查机制可能会影响它在海外市场的接受度。

    5. **对整个 AI 生态的启示**
    - DeepSeek 事件带来的最大启示在于:规模化的算力投入并不是唯一的成功路径。对算法效率、模型训练方式、数据质量的创新同样重要。
    - 也凸显了 AI 领域的“全球化”与“本土化”交织:一方面,中国企业对海外技术和开源成果有高度依赖;另一方面,不同国家的监管与政策环境会反作用于技术与商业模式。

    **总结来说**,DeepSeek 的出现既展示了中国 AI 公司在短期内实现大模型技术突破的可能性,也暴露了在知识产权、审查制度等方面的争议。它很可能在某些细分领域为行业带来新的竞争与活力,但要在全球市场上保持长期领先,还需要更多原创性突破与更开放的环境。对整个 AI 行业而言,DeepSeek 的案例提供了一个信号:技术与创新在地缘政治和商业利益的博弈中,将继续以非常快的速度演进和扩散。”

    o3mini high 有点答非所问。和 livebench 测试的一样,o1 的语言理解能力最强:D
    randychoi
        26
    randychoi  
       3 小时 27 分钟前 via iPhone
    @chesha1 估计用英文提问更好吧:D
    JiRouWaZi
        27
    JiRouWaZi  
       2 小时 43 分钟前
    @randychoi residential ip, 你用英文提问也是垃圾
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   732 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 19:40 · PVG 03:40 · LAX 11:40 · JFK 14:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.