四道题全部 AC 。。。
我连题目都没仔细看,就无复制粘贴题目给它,等它推理出结果就复制回提交框:
中间有提交错误的:
我把错误截图给大模型,让它继续推理,然后如此反复,除了最后一道题错了几次才推理出来,前边都是一把过,最后一道题错了两次推测出来了。
跟一个力扣刷了几千道的朋友吐槽用大模型刷题,虽然我在嘴硬,但我自己撑死了也就是三道题的水平。。。AI 算法水平至少高我一个大段位。。。。
不过还好,它用时大概半小时,比第一名耗时还长一些,碳基生物保住了一点脸面:
但想一想,从 OpenAI 发布 Chatgpt 到今天,也才几年的时间就已经发展到这个程度了,我原本以为程序员能干到 35 岁也行,到时候回老家养猪,就很抽象,感觉撑不到 35 岁就得被淘汰了。。。过年回去得提前调研下养猪方案了。。。
1
w568w 1 天前 12
大可不必妄自菲薄,从你给的这几题来看,大模型训练的时候数据集里肯定有对应题解了,它只是原样背诵答案罢了。
「看到题目会写这个算法本身」值 1 块钱,「理解算法背后的思想」值 10 块钱,「实际工程中与人交流并设计架构,想到现实的独特场景可以转化成这个算法问题来解决」值 1000 块钱。 |
2
RoccoShi 1 天前 via iPhone
leetcode 的题还是偏简单了,对于现在的大模型来说小菜一碟
|
3
CC11001100 OP @w568w 我开始是拿 hot100 来试的,觉得能做出来是因为早就有题解了,所以后来我拿周赛来试,周赛都是新题现出的,类似于高考试卷有模式可寻但都是新题,我记得之前力扣周赛排名高的话好像可以大厂绿色通道面试速通,感觉可能会出现新的作弊赛道,哎大意了直接发论坛了。。。
|
4
tcper 1 天前
你如果正经训练一下肯定比大模型厉害,人脑也是需要训练的
而且可以找找真正竞赛题让 ai 试试,几种算法的组合 ai 就不行了 |
5
CC11001100 OP @tcper 戳心了兄弟,我训练了,上学那会儿还专门刷过一段时间算法题,奈何资质愚钝。。。
|
6
ccoming 1 天前 via Android
拳头永远硬不过锤子,要学会使用工具。
|
7
CC11001100 OP @RoccoShi 第四道题能做出来,在码农里算法水平应该能算前 0.1% 。。。
|
8
levelworm 1 天前 via Android 1
@CC11001100 大模型的训练快多了。
不过说实话,我的确觉得 AI 代替部分码农的工作,不是很远的未来了。很可能大公司内部已经在做了。而且要命的是,码农还挺配合的。 很多朋友举的反例,我觉得都不是很大的问题。比如说需求不清楚 AI 也没办法。第一,需求不清楚,其实人也没办法,你还得继续交流,而交流的精准度和耐心,人未必比得上 AI ,第二,公司可以强制执行标准化需求,换句话说,与其让 AI 适应人,不如让人适应 AI 。 国内大厂我相信肯定有人在做了,就是不能说。我觉得首当其冲的大概就是数据分析,数据工程、前段这种直接面对业务(业务恨不得你们 24 小时相应),技术上又没啥特别难的东西。 |
9
neteroster 1 天前 via Android
R1 确实很猛,带思考的大模型做这种题只会越来越强,毕竟:结果可验证 + R1 指明了强化学习在推理 LLM 上的有效性,这俩一结合就能预估这种算法竞赛未来的 LLM 能打过所有人类就是和 alpha go 打败人类棋手一样自然的事情。
虽说如此,实际应用场景复杂得多,还要在 Agent 、超长记忆、持续学习这几个领域有所进步才行,现在的技术这几个方面是明显薄弱的。很期待未来的发展。 |
10
williamjing 1 天前
以后 leetcode 的分数就没意义了,因为你面对的都会是 AI 。以后面试看来默认需要手撕代码了。
|
11
mythabc 1 天前 2
积极拥抱变化寻找出路,不要再钻研代码细节。
(上回发了个 cursor 的帖子,还有人说我广告,时代都变了感觉 v2 有一帮冥顽不灵的人) |
12
tcper 1 天前
@CC11001100 你意思是自己刷一些题算训练了?你去看看 ACM 队员怎么训练的
|
14
majula 1 天前 12
想当年李世石柯洁输给阿尔法狗,岂不比楼主更加道心破碎。人家可都是实实在在的行业前 0.1%(不包括业余棋手)。
李世石没几年就宣布隐退了,理由是输给 AI 后,他再也无法享受围棋这项竞技。 柯洁则是一开始对 AI 各种冷嘲热讽,实战被吊打后则是破防嚎啕大哭。然后能明显感觉出来他对下棋越来越没有胜负欲,工作生活的重心也开始转移到围棋以外的地方。或许这就是我们这些“传统程序员”中一部分人的写照。 好在程序员这个职业的工作内容几乎不是“算法竞技”,现实场景的业务涉及到和形形色色的人、和其他(非计算机)系统的对接,这些目前看来还很难由 AI 独立搞定。 不过那些纯搞技术的“底层程序员”确实应该“睁眼看看世界”了,不然真的会被落在后面。我在 /t/1095887 #2 回复的后续,我们公司那帮老算法工程师在被 AI 降维打击一次后,现在也开始拥抱 AI ,用 LLM 辅助研究了。 |
15
jukanntenn 1 天前
高射炮打蚊子,别说大模型,我用搜索引擎也能达到同样的效果呀,这能说明什么问题呢?
|
16
kk2syc 1 天前
你让大模型来试试高考题,应该连大专都不够分数。
|
17
fpk5 1 天前 via iPhone
周赛是给你练习速度和熟练度的,半个小时三道题就差不多了。你不能跟计算器比乘除法。
|
19
mumbler 1 天前 1
现在最强模型是 gemini-2.0-flash-thinking-exp-01-21
aistudio.google.com |
23
beginor 23 小时 49 分钟前 via Android
其实大可不必,模型能刷算法,但是不会做业务
|
24
cooltechbs 23 小时 3 分钟前
最新一期是又变容易了吗?我记得 2024 下半年力扣周赛难度陡增,第四题基本都是信竞级别,远超面试题难度,就是为了阻止大模型作弊啊。
|
25
xuanbg 22 小时 45 分钟前
笑死,大模型能做力扣是因为人做过。没人做过的题它可做不了。
|
26
abc612008 22 小时 32 分钟前
> 严禁使用任何代码生成工具或者外部辅助手段解题,包括但不限于将题目描述、测试用例或解题代码输入到外部辅助工具中的行为
lc 竞赛用 LLM 生成代码是禁止的。 |
27
RightHand 21 小时 7 分钟前 via Android
有没有可能是这个原因,力扣上大部份都是经典的套路,而大模型训练的就是这些
|
28
mayli 20 小时 28 分钟前
正常吧,https://adventofcode.com/ 的简单题大部分 claude 都可以秒解一次过。
|
29
jguo 20 小时 12 分钟前
这是好事啊,说明用所谓的算法题考察程序员水平并不科学
|
31
iorilu 19 小时 57 分钟前
很正常, 很显然, 很多大模型都拿这些代码题训练得
你拿训练内容考模型, 那肯定是送分 |
32
encro 19 小时 48 分钟前
阁下何故如此,成仙路并未断,而是变成人人可修仙了。
难道我们开发程序不是为了做产品,赚取高扇出的价值吗?现在有工具让我们能更快的出产品,那么就好好利用,赚他一笔! |
33
angryfish 19 小时 40 分钟前
你这种想法,就像传统农民看到收割机高效率完成收割,感到崩溃一样。
实际上这些工具都是辅助你工作的,不管以后如何发展,总得有人来指挥 ai ,这就是以后程序员的工作。程序员由写代码命令向使用自然语言转变。或许以后程序员不用秃头得那么厉害了吧。 |
34
cooltechbs 19 小时 28 分钟前
LZ 还打算用这种方式刷排名啊??小心封号。。其实你这把测试就该用过往的竞赛(力扣和 CF 一样有虚拟参赛功能),不该参加现场竞赛的。。。
|
35
wind1986 19 小时 20 分钟前
@jukanntenn 搜索引擎应该还是有点悬的, 搜索引擎是提供思路, 你要自己组合写, AI 是能直接给你答案(针对 OP 这个 case)
|
36
gxt92 19 小时 19 分钟前
试了两道题目,deepseek 思考时间很长一道题 360 秒,两道题全部答对,确实很强。
但是周赛比赛时不能用 AIGC 作弊 |
37
snitfk 19 小时 16 分钟前
人脑的价值在发散性。如果要比算法比计算能力这点在 GOOGLE 的 AlphaGo 击败李世石的时候就已经明确肯定是人类输了。
|
39
lwldcr 19 小时 9 分钟前
这种命题作文 人肯定干不过机器啊
只要是有成熟解法的东西,AI 做(查)出来太容易了 |
40
glcolof 19 小时 7 分钟前 1
有没有可能,第一名用的也是 AI ?
|
41
cooltechbs 19 小时 1 分钟前
@glcolof 至少这场不是,前几名都是两三年前竞赛分就很高了
|
42
meilicat 18 小时 59 分钟前
|
43
huangyezhufeng 18 小时 50 分钟前
从之前的博客截取了 AI 编程相关的一段,希望能有所帮助吧: https://datahonor.com/blog/2024/12/23/ai_think_2024/#ai_1
AI 的黄金时代¶ 书接上文,我其实并不认为现在的 LLM 是“智能”的,我认为它只是一个庞大而又精密的机器。 但是就像所有精密的机器 (比如计算机) 一样,LLM 也有着无限的潜力,可以在各个领域发挥巨大的作用——即使它没有所谓的“智能”。 AI 辅助编程¶ Redis 的作者 Salvatore Sanfilippo 在年初写过一篇博客 LLMs and Programming in the first days of 2024. 博客中介绍了 LLM 在编程领域的一些应用,他认为 LLM 很适合用来替代一些琐碎的工作,比如用来写一些一次性的脚本,做一些数据分析等, 这样可以让程序员们更专注于更有意义的工作,比如设计架构,优化性能等。文章另外还有很多有有趣的观点: LLMs and Programming in the first days of 2024 In the field of programming, perhaps their ability would have been of very little interest up to twenty or thirty years ago. Back then you had to know a couple of programming languages, the classic algorithms, and those ten fundamental libraries. The rest you had to add yourself, your own intelligence, expertise, design skills. If you had these ingredients you were an expert programmer, able to do more or less everything. Over time, we have witnessed an explosion of frameworks, programming languages, libraries of all kinds. An explosion of complexity often completely unnecessary and unjustified, but the truth is that things are what they are. And in such a context, an idiot who knows everything is a precious ally. 下面是这段话的中文翻译 (来自宝玉): LLMs and Programming in the first days of 2024 在编程领域,直到二十或三十年前,这些能力可能还不太引人注目。那时,你需要掌握几种编程语言、经典算法以及那些基本的库。 其余的则依靠你自己的智慧、专业知识和设计能力。具备这些素质,你就能成为一名全能的专家级程序员。 然而,随着时间的推移,我们见证了框架、编程语言、各种库的大量涌现。这种复杂性通常是不必要的,甚至无法自圆其说,但事实就是如此。 在这样的情况下,一个无所不知的“白痴”成了宝贵的盟友。. 这里点明了一个事实:现在的编程环境变得越来越复杂,这也意味着程序员需要掌握更多的知识,花费更多的时间来学习和工作, 而 LLM 可以通过辅助编码来屏蔽这些复杂性来帮助程序员们减轻这些负担,进而让他们专注于更有意义的工作。 这点在 2024 这一年 AI 编程领域的发展中得到了很好的体现,比如 Cursor ,Windsurf 等辅助编程工具的强势崛起。 这些辅助编程工具在前端开发领域都有比较好的体验,比如这些工具目前可以通过简单的几句描述就生成漂亮的网页。 我个人浅薄的看法是,前端开发的技术栈变化非常快,也有很多框架,库等,这些都增加了前端开发的复杂性,正好对应了上面 Salvatore 提到的问题 (“框架、编程语言、各种库的大量涌现”)。 而通过 AI 辅助编程工具确实可以很好地解决这些问题:我们不必再去看各个框架自定义的 API ,只需要简单地描述我们想要的效果,LLM 就会帮我们生成符合描述的代码。 同样地,AI 辅助编程在生成数据分析报告,辅助编写 SQL 等方面也有着不错的表现。 这点在上面的博客中也有提到,而我个人在日常工作中也深有体会:AI 已经在实打实地帮助我们减轻很多工作量。 我并不认为 AI 会取代真正的程序员 (未来也不会),但其换掉这些琐碎的编码工作是大势所趋。 当然这里的“琐碎”是相对的,比如我需要一个 Web 页面来简单地展示数据,这个工作对于我来说就是琐碎的; 但是如果我们需要的是一个拥有良好交互体验且具有相当程度美观性的页面,那么这个工作可能就不再是琐碎的了。 同样地对于数据分析也是,如果我们只需要简单地统计一下数据,那么这个工作就是琐碎的; 如果我们需要从海量数据中找出一些有价值的信息,那么这个工作就不再是琐碎的了。 另外 Salvatore 提到了另外一个值得思考的问题: LLMs and Programming in the first days of 2024 I regret to say it, but it's true: most of today's programming consists of regurgitating the same things in slightly different forms. High levels of reasoning are not required. LLMs are quite good at doing this, although they remain strongly limited by the maximum size of their context. This should really make programmers think. Is it worth writing programs of this kind? Sure, you get paid, and quite handsomely, but if an LLM can do part of it, maybe it's not the best place to be in five or ten years. 下面是这段话的中文翻译 (来自宝玉): LLMs and Programming in the first days of 2024 不得不说,这是一个事实:现今的编程大多是在微调同样的内容,只是形式略有变化。这种工作并不需要太高的推理能力。 大语言模型在这方面表现出色,尽管它们的能力仍然受限于上下文长度。这个现象应该引起程序员的深思:真的值得去编写这类程序吗? 虽然可以赚到不错的收入,但如果大语言模型也能完成其中一部分工作,那么在未来五到十年,这可能并非最佳的职业发展方向。 我个人非常赞同这个观点,也认为这个问题提的非常好: "Is it worth writing programs of this kind?" 我相信在此后的几年时间,对这个问题的讨论会越来越多,而我们对这个问题的不同理解也会进一步地影响我们的未来职业发展方向。 |
44
edward1987 18 小时 33 分钟前
@xuanbg #25 是和普通程序员比,没人做过的普通程序员大概率也做不出来。
|
45
punkerhyde 18 小时 25 分钟前
@kk2syc 你这还停留在哪年?
|
46
lulaolu 18 小时 15 分钟前
第一天:“一堆冰冷的代码试图模仿人类智慧。”
第二天:“无用的技术玩具学会了下棋。” 第三天:“语言模型靠死记硬背才做出的力扣。” 第四天:“人工智能有智能但无智慧。” 第五天:“超级智能主导了科学突破。” 第六天:“坚决维护以 ChatGPT-99999 为核心的……!” |
47
mumbler 18 小时 12 分钟前
@kk2syc #21 抽卡是大模型的思考方式,不同于人,1 分钟抽 100 张卡,正确率能达到 99.9%。目前测试方式按人思维设计的,要求一次做对,大模型当然得分低
|
48
fulajickhz 18 小时 11 分钟前
|
49
SherlockKevin 17 小时 47 分钟前
守正出奇 知行合一
|
50
woctordho 16 小时 35 分钟前 via Android
汽车比人快,人就不赛跑了吗?
|
51
uni 16 小时 3 分钟前
你的个人价值就体现在 leetcode 上面?
|
52
zero2me 15 小时 59 分钟前
思维太狭隘了,LLM 只能提高效率,绝对取代不了人,多样性和创造性是 LLM 无法取代的
|
53
noahlias 15 小时 15 分钟前
建议秒下 codeforce
|
54
ptstone 15 小时 11 分钟前
从 OpenAI 发布 Chatgpt 到今天,也才几年的时间,可是人工智能的研究已经有十几年了吧,甚至更久,tranform 这种都好多年了
|
55
FlyToSKy 14 小时 58 分钟前
现阶段 AI 还是推理阶段,发展到真正的 Agent AI 的时候才能说道心破碎了。
|
56
wangyzj 14 小时 55 分钟前
只能说你用它最擅长的场景做了测试,肯定是好的
|
57
jinhanzhang2005 14 小时 50 分钟前
@woctordho 但是出现汽车后,跑步从大部分人需要变成了大部分人不需要的一种行为了
|
58
ziyanghua 14 小时 46 分钟前
@CC11001100 #3 疫情远程面试的时候,就有很多人在用 AI 帮忙过面了。
|
59
LichMscy 14 小时 27 分钟前
@ziyanghua #58 这种 AI 作答的 太容易问出来了 基本上先重复下你的问题 然后等待 0.5-1 秒 开始滔滔不绝
之前面过不少类似情况的候选人 履历再好 直接就 pass 再其次 很多场景问题 AI 也无法给你准确的答案 你有没有类似的经验或者做过相关工作 一眼就可以看出来 |
60
opiviqo 14 小时 24 分钟前
嗨 你咋不让 AI 解决一下 黎曼猜想 呢
|
61
Meld 14 小时 17 分钟前
哥们,你用小猿搜题去解过去的高考数学,能考满分,那你还上大学吗?
|
62
asilencebtf 13 小时 30 分钟前
@tcper ai 都已经把 codeforces 杀穿了,acmer 又怎么样
|
63
zzzzzzggggggg 13 小时 19 分钟前
为什么要跟计算器比加减乘除
|
64
sampeng 12 小时 43 分钟前
deepseek 真的算了。。很容易卡住
|
67
shm7 11 小时 50 分钟前
说明你连 LLM 在编码方面的长处和短处一点都不了解,就开始给自己的编程人生妄下断语...
|
68
noneofmyb7s 11 小时 49 分钟前
你要被封号了,真的,估计一个月不能打周赛起步,我只是 3-4 题用了 GPT ,给我封了俩月
|
69
poltao 11 小时 43 分钟前
你小子 Github 主页有意思
|
70
linzyjx 11 小时 27 分钟前
大模型背题了
|
71
kk2syc 11 小时 7 分钟前
|
72
fangxisama 11 小时 3 分钟前
其实没意义吧,就相当于你和汽车比速度,和千斤顶比力量,和计算器比计算,等等。这些都是人类为了扩大自己的能力而发明的工具而已,这些工具全是会在方方面面碾压人类,但使用它们的,终究还是人类。
|
73
LDa 10 小时 59 分钟前
越是算法 基础组件类型的代码 AI 越是得心应手 反而 crud boy 暂时还能保住工作
|
74
InkStone 10 小时 56 分钟前
@kk2syc 首先你必须明白一点,申论本来就是一眼假大空的东西,就是因为这样我才说它适合 LLM 。
其次,不要因为你自己不用使用 LLM ,就觉得 LLM 能力不行。简单来说,用 LLM 写出好的申论,你需要同时会写申论,并且会用 LLM 。这两点缺一不可。 |
75
user8341 10 小时 8 分钟前
真的使用刀剑的时代过去了。武功练得再好也不如一把手枪。
|
76
windyboy 9 小时 12 分钟前
就是要适应新的工具而已,用久了了其实推理没那么好用,对于稍微复杂一点的还是需要你去审核,人工拆分问题。不过时代确实变了,需要大家适应而已
|
78
watora 7 小时 38 分钟前
从 22 年底发布的 chatgpt3.5 到现在也就两年多一点罢了,不知道为什么有人自信觉得 ai 无法替代人类。最愚笨的人和最聪明的人在生理结构上没什么区别,如果说 ai 能替代初级程序员的话那没理由替代不了专家,而且以现在的发展速度看最多也就一两年,很可能三年之后程序员这个职业都要消失了
|
79
zhouyin 7 小时 34 分钟前
鼓吹 ai 的都是傻逼 智商低 ai 根本不会创造东西 而是统计学
|
80
shanks 6 小时 57 分钟前
我的感觉是,有确定答案、模式、方法的问题,交给 AI 来做是没问题的。但是面对之前没有人搞过的,比较偏门或者比较底层的东西,这个 AI 做不来,因为这方面语料很少。比如科研领域,你即使给 AI 投喂所有的 SCI 论文,ta 也没办法写一个新的 SCI 出来,因为没有创新性;换个例子,比如 Linux 社区最新的问题,都是实际生产过程中遇到的、还没解决的问题,交给 AI 同样搞不定。说白了,AI 就是个智能字典或者工具,只能辅助,关键还是靠人。
|
81
NOspy 6 小时 24 分钟前 1
给您背一段课文:
登高而招,臂非加长也,而见者远;顺风而呼,声非加疾也,而闻者彰。 假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。 君子生非异也,善假于物也。 |
82
houhaibushihai 5 小时 34 分钟前
老哥测测 codeforces 或者 atcoder 试试看效果
|
83
lovestudykid 4 小时 9 分钟前
@houhaibushihai o3 已经把 cf 刷穿了
|