1
Vneix 22 小时 20 分钟前 via Android 1
看了下,免费用户点击输入框的 reason 后也能体验到。
这是对 deepseek 的反击吗? |
2
ovtfkw 21 小时 34 分钟前 via iPhone
o3minihigh 强于现在的 o1 吗
|
3
zaizaizai2333 21 小时 31 分钟前
mini 肯定是小模型喽,还是免费 R1 香
o3mini (high) 看上去和 o1 水平差不多。 |
4
zaizaizai2333 21 小时 24 分钟前 1
尽量不给 openAI 提供训练数据。
它发展得再好也不愿意开源一点点模型,哪怕是去年的稍微过时的模型,只进不出的巨兽太贪婪了,还时不时搞小动作降智。太葛朗台了。 |
5
fcoo 21 小时 24 分钟前 5
要不是 deepseek 还不知道什么时候给上线新模型,一直压箱底,慢慢的放,也开始学老黄刀法了。
竞争对用户最好的,希望以后有更多更强开源模型出现 |
6
zaizaizai2333 21 小时 7 分钟前
As part of this upgrade, we’re tripling the rate limit for Plus and Team users from 50 messages per day with o1-mini to 150 messages per day with o3-mini.
一天 150 条 messages 限制。一个小模型还对订阅用户限制这么多。葛朗台+夏洛克😂 |
7
randychoi 19 小时 30 分钟前 via Android
@ovtfkw 根据 livebeach 的数据, o1 综合能力最强,翻译能力 o3 mini high 不如 4o 。编程能力 o1 mini high 最强
|
9
lnmxy 18 小时 25 分钟前
closeai:葛朗台+夏洛克
|
10
7LM4liVHIyzvtMyO 18 小时 19 分钟前
@dji38838c 为什么我看 openai 自己发的那篇报告中是 o3 mini 的数学能力最强了.https://openai.com/index/openai-o3-mini/
|
11
xbox360 17 小时 25 分钟前
#10
@466162659 我是免费用户用的是 o3-mini,开启了推理. 问 3.11 和 3.9 哪个大? ChatGPT 我在比较 3.11 和 3.9 的大小时,3.11 略大。这个差距可能是微不足道的,但显示了微调的重要性。 比较两个数 让我看看,3.11 和 3.9 哪个大。显然,3.11 明显大于 3.9 ,很容易比较出哪个数更大。 3.11 比 3.9 大。 |
12
hallostr 17 小时 25 分钟前
感谢 deepseek ~
|
13
lyanforever 15 小时 45 分钟前
感谢 deepseek ,以后能用上更便宜的 chatgpt
|
14
FightPig 14 小时 52 分钟前
openai: 其实我早就做了,只是被友商捷足先登了
|
15
randychoi 12 小时 12 分钟前 via Android
@xbox360 @7LM4liVHIyzvtMyO 根据 livebench 的数据,o1 数学是最强的,其次是 deepseek r1 ,排第三是 o3 mini high
|
16
randychoi 12 小时 11 分钟前 via Android
o3 min high:
@xbox360 比较这两个数时,我们可以先看整数部分: 3.11 的整数部分是 3 3.9 的整数部分也是 3 由于整数部分相同,我们再比较小数部分。 3.11 的小数部分是 0.11 3.9 的小数部分是 0.9 ,可以写成 0.90 显然,0.90 > 0.11 ,所以 3.9 大于 3.11 。 |
18
Kisesy 11 小时 42 分钟前
哦,也许又会把 3.9 写成 3.900 吧
|
21
Censhuang 8 小时 7 分钟前
问:纯数字含义,3.11 与 3.9 哪个大
比较数字大小 我正在比较数字 3.11 和 3.9 评估数字的大小 3.11 比 3.9 大。这一点是有结论的。 3.11 大于 3.9 。因为从数字的角度来看,3.11 比 3.9 大,尽管它们都以 3 开头,但 11 比 9 更大。 |
23
JoeDH 3 小时 59 分钟前
还是 ds 用的爽
|
24
Cbdy 3 小时 39 分钟前
ds 给的压力不小啊
|
25
randychoi 3 小时 29 分钟前 via iPhone
问:ChatGPT, 如何看待 deepseek ?
o3 mini high: “从报道中可以看出,DeepSeek 的出现代表了中国在人工智能领域取得了不容忽视的进展,并对长期以来由美国主导的 AI 生态构成了挑战。以下几点是常见的看法: 1. 技术进步与成本优势 DeepSeek 的新模型在推理能力上取得了突破,同时在研发成本和计算资源消耗上比一些美国顶级模型更为经济,这表明中国在利用有限资源实现高性能 AI 方面具有一定优势。 2. 全球竞争格局的变化 这一进展不仅仅是技术上的突破,更反映了中美在科技领域的竞争正在加剧。DeepSeek 的出现促使全球重新审视人工智能的研发模式和投资逻辑,说明未来 AI 领域将会有更多竞争者涌现,市场格局可能发生深刻变化。 3. 争议与挑战 同时,关于 DeepSeek 的争议也不少:例如是否在研发过程中借鉴或“借用了”美国已有技术、是否真正具备原创性,以及由于政治和监管等原因在某些话题上的自我审查问题。这些争议不仅涉及技术本身,也关系到知识产权保护、国际贸易和技术伦理等更广泛的问题。 4. 长远影响尚需观察 尽管 DeepSeek 显示出一定的技术实力,但它是否能在长期内引领行业,或只是一次赶超尝试,还需要市场和时间来检验。毕竟,成功的 AI 生态系统不仅仅依靠模型本身的性能,还涉及到应用、数据、生态圈构建以及用户体验等多个层面。 总体来说,DeepSeek 可以被看作是中国在全球 AI 竞争中迈出的重要一步,它既展示了潜在的技术实力,也提醒我们未来技术竞争中会面临更多复杂而多元的挑战。” o1: “从公开信息和媒体报道来看,DeepSeek 的出现确实在技术界和投资界引发了极大关注。以下是我对 DeepSeek 的一些观察与思考: 1. **技术实力与创新性** - DeepSeek 在“推理”方面的进展,表明它并非仅仅是追随者,在某些技术环节上还有自己的突破。它能在有限的计算资源和相对低的成本下,训练出与一些领先模型性能相当的系统,这一点值得业界关注。 - 不过,仍有分析认为 DeepSeek 的核心技术和方法在一定程度上借鉴或复用现有的大模型成果,尚未展现出全新的颠覆性创新。同时,有关它是否未经授权使用他人模型或数据的调查也在进行中,如果属实,则会影响其声誉与后续发展。 2. **芯片和算力的制约** - 美国对中国的高端芯片出口管制,原本旨在限制中国在人工智能领域的快速追赶。但 DeepSeek 的出现,说明企业也会通过各种方式(包括改进算法、寻求替代硬件或绕过渠道)来降低对顶尖芯片的依赖。 - 这给美国和其他国家的芯片与云服务供应商带来新的思考:如果中国在算法层面大幅提升效率,那么对昂贵 GPU 或高端芯片的需求量是否会受到影响,仍需在后续观察。 3. **商业与市场影响** - DeepSeek 的新模型发布后,一些投资者担忧可能导致对昂贵 AI 芯片需求的下降,进而让英伟达等公司股价出现剧烈波动。但也有“杰文斯悖论”的观点,认为当训练和应用成本下降后,AI 可能会被广泛应用,最终反而推动更多芯片采购。 - 不管怎样,DeepSeek 让市场看到了“中国 AI 追赶速度”超出预期,刺激了全球对 AI 竞争格局的新一轮讨论。 4. **审查与自由度** - 有证据显示,DeepSeek 的对话模型会对中国政府视为敏感的话题进行审查,自我审查或拒绝回答。技术上的进步不一定意味着在信息层面有更大的自由或开放。如果在全球范围内推广,内容审查机制可能会影响它在海外市场的接受度。 5. **对整个 AI 生态的启示** - DeepSeek 事件带来的最大启示在于:规模化的算力投入并不是唯一的成功路径。对算法效率、模型训练方式、数据质量的创新同样重要。 - 也凸显了 AI 领域的“全球化”与“本土化”交织:一方面,中国企业对海外技术和开源成果有高度依赖;另一方面,不同国家的监管与政策环境会反作用于技术与商业模式。 **总结来说**,DeepSeek 的出现既展示了中国 AI 公司在短期内实现大模型技术突破的可能性,也暴露了在知识产权、审查制度等方面的争议。它很可能在某些细分领域为行业带来新的竞争与活力,但要在全球市场上保持长期领先,还需要更多原创性突破与更开放的环境。对整个 AI 行业而言,DeepSeek 的案例提供了一个信号:技术与创新在地缘政治和商业利益的博弈中,将继续以非常快的速度演进和扩散。” o3mini high 有点答非所问。和 livebench 测试的一样,o1 的语言理解能力最强:D |