1
p7IySTldqB 3 天前
今年 AI 大爆发令人兴奋。
|
![]() |
2
chipipi 3 天前 ![]() “工作中常见到的炮弹问题”
|
![]() |
3
Satansickle 3 天前
咋?老哥是华为驻非洲工程师?
|
4
paopjian 3 天前
妈耶, 老哥是军工设计师么, 为什么会有弹道预测的问题
|
![]() |
5
mingtdlb 3 天前
怎么认为他很强?
 |
![]() |
8
me1onsoda 3 天前
大模型好像都是发布一开始强无敌,然后开始降智了。大模型质量问题,应该要有个监管的机制。
|
9
lthon 3 天前
还在等 Claude 4
|
10
sunny352787 3 天前
哈哈哈哈哈哈这例子要吓死了,其实是做游戏的吧?
|
11
LaTero OP |
12
LaTero OP @mingtdlb 判断字符本来就不是 AI 该做的事,因为原理上 AI 收到的都是 token ,一个 token 可能有好几个字。而且假如真的有了 AGI ,和人类一样的智力水平,你觉得它会浪费算力去数吗?假如是一个聪明的人类,他应该做的是使用工具。AGI 也应该是写一个程序去数,不是自己数。最近 AI 进步也都是在数学、逻辑推理等方面。
|
![]() |
14
hiveex 3 天前
Poe 用户等上线体验
|
![]() |
15
pizone 3 天前
不知什么时候能用上 Grok 3 的 api ,还是有点期待。
|
16
CodeAllen 3 天前
没必要问 AI 字符问题,这个跟 NLP 的 token 分词技术有关系,没什么意义。
这就有点像一个人口头问你,计算“饕餮盛宴”这几个字有几个笔画,能当面正确写下这四个字的人都不多吧,还得数笔画,有什么意义? |
17
sunny352787 3 天前
@LaTero 哎,同行的敏锐性~
|
![]() |
18
stone9527 3 天前
|
19
LaTero OP ![]() @stone9527 没问题呀,现在主流的模型这个都不会错的吧。我平时主用 openrouter ,这个网站的 chatroom ,预设的几个问题就有 9.9 和 9.11 哪个大,还有 strawberry 里几个 r 。后者还有些模型会错,但是前者这样比大小的基本都是没问题的。
|
![]() |
20
pkoukk 3 天前
强是很强..
但是老🐴用了快 10 万张 h100 ,居然只获得了 1400 分出头,仅仅比 R1 强 40 多分,3%左右 而且这么大的训练规模,预计参数量也不小,推理消耗估计也挺大 有点不及预期了 |
![]() |
21
br00k 3 天前
试了下,感觉没有多少差距。不及预期。
|
![]() |
23
yukino 3 天前 via Android
要不你跟隔壁 openai 楼的老哥打一架
|
![]() |
24
kaedea 2 天前 via Android
做一下今年考公的行测题试试
|
![]() |
25
Ehend 2 天前
编程领域感觉不如 chatgpt 和 deepseek
|
![]() |
26
gitxuzan 1 天前
编程方面不行,比 gpt 差
|
![]() |
27
gitxuzan 1 天前
deepseek 如果有这么强的算力,不是要排行老大了。
|