手贱拿大模型试了下最近一次的 LeetCode 周赛,道心破碎了,成仙路已断,前路在何方?
四道题全部 AC 。。。
我连题目都没仔细看,就无复制粘贴题目给它,等它推理出结果就复制回提交框:
中间有提交错误的:
我把错误截图给大模型,让它继续推理,然后如此反复,除了最后一道题错了几次才推理出来,前边都是一把过,最后一道题错了两次推测出来了。
跟一个力扣刷了几千道的朋友吐槽用大模型刷题,虽然我在嘴硬,但我自己撑死了也就是三道题的水平。。。AI 算法水平至少高我一个大段位。。。。
不过还好,它用时大概半小时,比第一名耗时还长一些,碳基生物保住了一点脸面:
但想一想,从 OpenAI 发布 Chatgpt 到今天,也才几年的时间就已经发展到这个程度了,我原本以为程序员能干到 35 岁也行,到时候回老家养猪,就很抽象,感觉撑不到 35 岁就得被淘汰了。。。过年回去得提前调研下养猪方案了。。。
用来测试的周赛题目链接: leetcode.cn/contest/weekly-contest-433/
我已经报名了下次的力扣周赛,准备混个历史最高排名玩玩看看能到多少。。。
大可不必妄自菲薄,从你给的这几题来看,大模型训练的时候数据集里肯定有对应题解了,它只是原样背诵答案罢了。
「看到题目会写这个算法本身」值 1 块钱,「理解算法背后的思想」值 10 块钱,「实际工程中与人交流并设计架构,想到现实的独特场景可以转化成这个算法问题来解决」值 1000 块钱。
leetcode 的题还是偏简单了,对于现在的大模型来说小菜一碟
我开始是拿 hot100 来试的,觉得能做出来是因为早就有题解了,所以后来我拿周赛来试,周赛都是新题现出的,类似于高考试卷有模式可寻但都是新题,我记得之前力扣周赛排名高的话好像可以大厂绿色通道面试速通,感觉可能会出现新的作弊赛道,哎大意了直接发论坛了。。。
你如果正经训练一下肯定比大模型厉害,人脑也是需要训练的
而且可以找找真正竞赛题让 ai 试试,几种算法的组合 ai 就不行了
戳心了兄弟,我训练了,上学那会儿还专门刷过一段时间算法题,奈何资质愚钝。。。
拳头永远硬不过锤子,要学会使用工具。
第四道题能做出来,在码农里算法水平应该能算前 0.1% 。。。
大模型的训练快多了。
不过说实话,我的确觉得 AI 代替部分码农的工作,不是很远的未来了。很可能大公司内部已经在做了。而且要命的是,码农还挺配合的。
很多朋友举的反例,我觉得都不是很大的问题。比如说需求不清楚 AI 也没办法。第一,需求不清楚,其实人也没办法,你还得继续交流,而交流的精准度和耐心,人未必比得上 AI ,第二,公司可以强制执行标准化需求,换句话说,与其让 AI 适应人,不如让人适应 AI 。
国内大厂我相信肯定有人在做了,就是不能说。我觉得首当其冲的大概就是数据分析,数据工程、前段这种直接面对业务(业务恨不得你们 24 小时相应),技术上又没啥特别难的东西。
R1 确实很猛,带思考的大模型做这种题只会越来越强,毕竟:结果可验证 + R1 指明了强化学习在推理 LLM 上的有效性,这俩一结合就能预估这种算法竞赛未来的 LLM 能打过所有人类就是和 alpha go 打败人类棋手一样自然的事情。
虽说如此,实际应用场景复杂得多,还要在 Agent 、超长记忆、持续学习这几个领域有所进步才行,现在的技术这几个方面是明显薄弱的。很期待未来的发展。
以后 leetcode 的分数就没意义了,因为你面对的都会是 AI 。以后面试看来默认需要手撕代码了。
积极拥抱变化寻找出路,不要再钻研代码细节。
(上回发了个 cursor 的帖子,还有人说我广告,时代都变了感觉 v2 有一帮冥顽不灵的人)
你意思是自己刷一些题算训练了?你去看看 ACM 队员怎么训练的
碳基生物何尝不是在背答案,效率还低。很多人一年半载再去刷 h100 又不会了。背到极致也算牛逼
想当年李世石柯洁输给阿尔法狗,岂不比楼主更加道心破碎。人家可都是实实在在的行业前 0.1%(不包括业余棋手)。
李世石没几年就宣布隐退了,理由是输给 AI 后,他再也无法享受围棋这项竞技。
柯洁则是一开始对 AI 各种冷嘲热讽,实战被吊打后则是破防嚎啕大哭。然后能明显感觉出来他对下棋越来越没有胜负欲,工作生活的重心也开始转移到围棋以外的地方。或许这就是我们这些“传统程序员”中一部分人的写照。
好在程序员这个职业的工作内容几乎不是“算法竞技”,现实场景的业务涉及到和形形色色的人、和其他(非计算机)系统的对接,这些目前看来还很难由 AI 独立搞定。
不过那些纯搞技术的“底层程序员”确实应该“睁眼看看世界”了,不然真的会被落在后面。我在 /t/1095887 #2 回复的后续,我们公司那帮老算法工程师在被 AI 降维打击一次后,现在也开始拥抱 AI ,用 LLM 辅助研究了。
高射炮打蚊子,别说大模型,我用搜索引擎也能达到同样的效果呀,这能说明什么问题呢?
你让大模型来试试高考题,应该连大专都不够分数。
周赛是给你练习速度和熟练度的,半个小时三道题就差不多了。你不能跟计算器比乘除法。
#14
这个还不算底层。至少要到操作系统编译器这个层次,然后接触硬件啥的。AI 对于缺乏公开资料的东西还是不行,还能苟几年。
现在最强模型是 gemini-2.0-flash-thinking-exp-01-21
aistudio.google.com
#16 现在三巨头大模型有博士水平,但不能保证一次做对,需要抽卡,重试多次高考全部能拿下
但是高考对于大多数人来说只有一次机会,所以什么水平不重要,重要的是考题模型。换个说法吧,让大模型去考申论,永远都过不了。
#19
给它做了点简单的数论题,还不错。
其实大可不必,模型能刷算法,但是不会做业务
最新一期是又变容易了吗?我记得 2024 下半年力扣周赛难度陡增,第四题基本都是信竞级别,远超面试题难度,就是为了阻止大模型作弊啊。
笑死,大模型能做力扣是因为人做过。没人做过的题它可做不了。
严禁使用任何代码生成工具或者外部辅助手段解题,包括但不限于将题目描述、测试用例或解题代码输入到外部辅助工具中的行为
lc 竞赛用 LLM 生成代码是禁止的。
有没有可能是这个原因,力扣上大部份都是经典的套路,而大模型训练的就是这些
正常吧, adventofcode.com/ 的简单题大部分 claude 都可以秒解一次过。
这是好事啊,说明用所谓的算法题考察程序员水平并不科学
那考啥,八股也会背,算法题也会 ac
很正常, 很显然, 很多大模型都拿这些代码题训练得
你拿训练内容考模型, 那肯定是送分
阁下何故如此,成仙路并未断,而是变成人人可修仙了。
难道我们开发程序不是为了做产品,赚取高扇出的价值吗?现在有工具让我们能更快的出产品,那么就好好利用,赚他一笔!
你这种想法,就像传统农民看到收割机高效率完成收割,感到崩溃一样。
实际上这些工具都是辅助你工作的,不管以后如何发展,总得有人来指挥 ai ,这就是以后程序员的工作。程序员由写代码命令向使用自然语言转变。或许以后程序员不用秃头得那么厉害了吧。
LZ 还打算用这种方式刷排名啊??小心封号。。其实你这把测试就该用过往的竞赛(力扣和 CF 一样有虚拟参赛功能),不该参加现场竞赛的。。。
搜索引擎应该还是有点悬的, 搜索引擎是提供思路, 你要自己组合写, AI 是能直接给你答案(针对 OP 这个 case)
试了两道题目,deepseek 思考时间很长一道题 360 秒,两道题全部答对,确实很强。
但是周赛比赛时不能用 AIGC 作弊
人脑的价值在发散性。如果要比算法比计算能力这点在 GOOGLE 的 AlphaGo 击败李世石的时候就已经明确肯定是人类输了。
申论对大模型来说是最容易的……要拿高分可能得做下定向的调校,只是想拿普通人的分数那太简单了。
这种命题作文 人肯定干不过机器啊
只要是有成熟解法的东西,AI 做(查)出来太容易了
有没有可能,第一名用的也是 AI ?
至少这场不是,前几名都是两三年前竞赛分就很高了
第 4 名早就说过了 做题只是享受这个思考的过程 。
从之前的博客截取了 AI 编程相关的一段,希望能有所帮助吧: datahonor.com/blog/2024/12/23/ai_think_2024/#ai_1
AI 的黄金时代¶
书接上文,我其实并不认为现在的 LLM 是“智能”的,我认为它只是一个庞大而又精密的机器。 但是就像所有精密的机器 (比如计算机) 一样,LLM 也有着无限的潜力,可以在各个领域发挥巨大的作用——即使它没有所谓的“智能”。
AI 辅助编程¶
Redis 的作者 Salvatore Sanfilippo 在年初写过一篇博客 LLMs and Programming in the first days of 2024. 博客中介绍了 LLM 在编程领域的一些应用,他认为 LLM 很适合用来替代一些琐碎的工作,比如用来写一些一次性的脚本,做一些数据分析等, 这样可以让程序员们更专注于更有意义的工作,比如设计架构,优化性能等。文章另外还有很多有有趣的观点:
LLMs and Programming in the first days of 2024
In the field of programming, perhaps their ability would have been of very little interest up to twenty or thirty years ago. Back then you had to know a couple of programming languages, the classic algorithms, and those ten fundamental libraries. The rest you had to add yourself, your own intelligence, expertise, design skills. If you had these ingredients you were an expert programmer, able to do more or less everything. Over time, we have witnessed an explosion of frameworks, programming languages, libraries of all kinds. An explosion of complexity often completely unnecessary and unjustified, but the truth is that things are what they are. And in such a context, an idiot who knows everything is a precious ally.
下面是这段话的中文翻译 (来自宝玉):
LLMs and Programming in the first days of 2024
在编程领域,直到二十或三十年前,这些能力可能还不太引人注目。那时,你需要掌握几种编程语言、经典算法以及那些基本的库。 其余的则依靠你自己的智慧、专业知识和设计能力。具备这些素质,你就能成为一名全能的专家级程序员。 然而,随着时间的推移,我们见证了框架、编程语言、各种库的大量涌现。这种复杂性通常是不必要的,甚至无法自圆其说,但事实就是如此。 在这样的情况下,一个无所不知的“白痴”成了宝贵的盟友。.
这里点明了一个事实:现在的编程环境变得越来越复杂,这也意味着程序员需要掌握更多的知识,花费更多的时间来学习和工作, 而 LLM 可以通过辅助编码来屏蔽这些复杂性来帮助程序员们减轻这些负担,进而让他们专注于更有意义的工作。
这点在 2024 这一年 AI 编程领域的发展中得到了很好的体现,比如 Cursor ,Windsurf 等辅助编程工具的强势崛起。 这些辅助编程工具在前端开发领域都有比较好的体验,比如这些工具目前可以通过简单的几句描述就生成漂亮的网页。 我个人浅薄的看法是,前端开发的技术栈变化非常快,也有很多框架,库等,这些都增加了前端开发的复杂性,正好对应了上面 Salvatore 提到的问题 (“框架、编程语言、各种库的大量涌现”)。 而通过 AI 辅助编程工具确实可以很好地解决这些问题:我们不必再去看各个框架自定义的 API ,只需要简单地描述我们想要的效果,LLM 就会帮我们生成符合描述的代码。
同样地,AI 辅助编程在生成数据分析报告,辅助编写 SQL 等方面也有着不错的表现。 这点在上面的博客中也有提到,而我个人在日常工作中也深有体会:AI 已经在实打实地帮助我们减轻很多工作量。
我并不认为 AI 会取代真正的程序员 (未来也不会),但其换掉这些琐碎的编码工作是大势所趋。 当然这里的“琐碎”是相对的,比如我需要一个 Web 页面来简单地展示数据,这个工作对于我来说就是琐碎的; 但是如果我们需要的是一个拥有良好交互体验且具有相当程度美观性的页面,那么这个工作可能就不再是琐碎的了。 同样地对于数据分析也是,如果我们只需要简单地统计一下数据,那么这个工作就是琐碎的; 如果我们需要从海量数据中找出一些有价值的信息,那么这个工作就不再是琐碎的了。
另外 Salvatore 提到了另外一个值得思考的问题:
LLMs and Programming in the first days of 2024
I regret to say it, but it's true: most of today's programming consists of regurgitating the same things in slightly different forms. High levels of reasoning are not required. LLMs are quite good at doing this, although they remain strongly limited by the maximum size of their context. This should really make programmers think. Is it worth writing programs of this kind? Sure, you get paid, and quite handsomely, but if an LLM can do part of it, maybe it's not the best place to be in five or ten years.
下面是这段话的中文翻译 (来自宝玉):
LLMs and Programming in the first days of 2024
不得不说,这是一个事实:现今的编程大多是在微调同样的内容,只是形式略有变化。这种工作并不需要太高的推理能力。 大语言模型在这方面表现出色,尽管它们的能力仍然受限于上下文长度。这个现象应该引起程序员的深思:真的值得去编写这类程序吗? 虽然可以赚到不错的收入,但如果大语言模型也能完成其中一部分工作,那么在未来五到十年,这可能并非最佳的职业发展方向。
我个人非常赞同这个观点,也认为这个问题提的非常好: "Is it worth writing programs of this kind?" 我相信在此后的几年时间,对这个问题的讨论会越来越多,而我们对这个问题的不同理解也会进一步地影响我们的未来职业发展方向。
#25 是和普通程序员比,没人做过的普通程序员大概率也做不出来。
你这还停留在哪年?
第一天:“一堆冰冷的代码试图模仿人类智慧。”
第二天:“无用的技术玩具学会了下棋。”
第三天:“语言模型靠死记硬背才做出的力扣。”
第四天:“人工智能有智能但无智慧。”
第五天:“超级智能主导了科学突破。”
第六天:“坚决维护以 ChatGPT-99999 为核心的……!”
#21 抽卡是大模型的思考方式,不同于人,1 分钟抽 100 张卡,正确率能达到 99.9%。目前测试方式按人思维设计的,要求一次做对,大模型当然得分低
理由是输给 AI 后,他再也无法享受围棋这项竞技。
就从 top 变成菜鸟了
碰到真神 这么快就放弃了
iptables 全干掉了 云面板上的网络防火墙全部选择打开 0.0.0.0/0 所有协议流量开放 试了半天还是不行,用了 net 命令,端口确实是监听了所有地址的流量 问题死…
aspoem.com 数据源是哪来的,自己敲进去的? 加个拼音模式 我文盲 doge 看到了,赞 数据太差了, 标签约等于没有 老哥和我做得这个。。 www.gu…
作为 Google Voice 的老用户,时常担心自己的号码被回收。Google 的政策实在是很迷惑,最近有认识的人在没有预警的情况下号码被回收了。所以想把号码转出去,但是实体…