找回密码
 立即注册
搜索
查看: 17982|回复: 51

[育儿] 码农今天被d师傅震撼了

[复制链接]
     
发表于 2025-2-7 13:17 | 显示全部楼层 |阅读模式
本帖最后由 R.I.P 于 2025-2-7 16:07 编辑

今天上班碰到个问题,具体来说是要解一个特定形状的LP当中用到的一个步骤。正好不是很急所以丢给官网r1试了下。

详细的问题prompt,生成的CoT以及最终答案在这里 https://gist.github.com/fotile96/4b617d65922e648a05c48923ada400ed
这个CoT是r1长考了633s后输出的,惊到我的是d师傅中间脑内构造了三四个小例子,来验证一个递归小算法的正确性(虽然都是尾递归)。

其实一开始是先问了中间那个快速选择变体怎么写,但是似乎目前ds每天第一次提问可能有特殊的优先级,之后回复接着问具体问题就一直报服务器忙了。之后也试了试siliconflow以及钉钉内嵌的r1,都在CoT打到一半的时候停了(感觉可能是context总长限制比官方紧很多)。后来官网突然成功了一次,就是上面gist贴出的结果。

我不太清楚最近十几年各种算法竞赛的难度膨胀了多少,印象里这个问题(去掉大致方向的提示)放在NOIP高中组做个非压轴题应该挺合适的。说r1能在这种细节问题上碾压95%的程序员应该不过分吧



====================

群友帮忙试了下,同样的prompt丢给o3mini,只会先排序然后二分或者快速选择。v3联网看起来也能直接答对

评分

参与人数 1战斗力 +1 收起 理由
偽物 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-7 13:18 来自手机 | 显示全部楼层
本帖最后由 约翰里德 于 2025-2-7 15:18 编辑

没有问题,ds厉害就厉害在只要是有固定答案的它基本能中。
但是没固定参考的就。。。
所以你们还是要多给深度求索冲💰,不冲💰怎么变得更强?
回复

使用道具 举报

     
发表于 2025-2-7 13:20 | 显示全部楼层
aider有个代码测试排名,r1很靠前的,而且deepseek是里面最便宜的
https://aider.chat/docs/leaderboards/

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2025-2-7 13:22 | 显示全部楼层
我也试过,对会用的来说已经是生产力级别了。以前非常会用搜索引擎是老登的必须,但是现在有了这个小登就不必掌握这个技能了。还得会用,但是可以去掉一个非常。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2025-2-7 13:29 来自手机 | 显示全部楼层
码农不是早就开始用llm写代码了吗。

我记得自己前年就开始大量使用了,无能力者的超能力外挂。
回复

使用道具 举报

     
发表于 2025-2-7 13:31 | 显示全部楼层
ymm1030 发表于 2025-2-7 13:22
我也试过,对会用的来说已经是生产力级别了。以前非常会用搜索引擎是老登的必须,但是现在有了这个小登就不 ...

搜索引擎就只能输入几个关键词和几种简单语法,  比AI的用法简单几个数量级了
回复

使用道具 举报

头像被屏蔽
发表于 2025-2-7 13:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-7 13:37 来自手机 | 显示全部楼层
吴怀在 发表于 2025-2-7 13:29
码农不是早就开始用llm写代码了吗。

我记得自己前年就开始大量使用了,无能力者的超能力外挂。 ...

推荐啥,cursor还是vsc配上啥插件?
回复

使用道具 举报

     
 楼主| 发表于 2025-2-7 13:38 | 显示全部楼层
吴怀在 发表于 2025-2-7 13:29
码农不是早就开始用llm写代码了吗。

我记得自己前年就开始大量使用了,无能力者的超能力外挂。 ...

我自己之前绝大多数使用都只是当作高级点的文档用,一般就是指明用某某库的某某函数干啥,让给个小例子

看到今天这种高度非平凡的思维链,终于有种这早就不是在拼尸块的实感了
回复

使用道具 举报

     
发表于 2025-2-7 13:39 | 显示全部楼层
早就开始了,我做C#开发的,只要描述的够详细,给出的方法需要调整的就越小,还能给出特别神奇的写法
目前迷茫的爽着。。。
回复

使用道具 举报

     
发表于 2025-2-7 13:43 来自手机 | 显示全部楼层
所有现在码农只有转需求分析一途。半桶水的编程经验和算法变得很廉价
回复

使用道具 举报

     
发表于 2025-2-7 13:47 | 显示全部楼层
"服务器繁忙,请稍后再试。"
回复

使用道具 举报

     
发表于 2025-2-7 14:00 | 显示全部楼层
coldhot3 发表于 2025-2-7 13:37
推荐啥,cursor还是vsc配上啥插件?

我用的cline还可以
回复

使用道具 举报

     
发表于 2025-2-7 14:07 | 显示全部楼层
quick selection 这种放现在应该算签到了吧
回复

使用道具 举报

     
发表于 2025-2-7 14:08 | 显示全部楼层
是不是就嵌入式能苟最久了
回复

使用道具 举报

     
发表于 2025-2-7 14:16 | 显示全部楼层
lyzsuper 发表于 2025-2-7 14:08
是不是就嵌入式能苟最久了

嵌入式已经被上游芯片厂商卷没了。不知道怎么开始是吧,我们 sdk 提供大量常见功能实现。不会用 sdk 是吧,派个技术支持给你们写代码。只要你肯用我们的芯片,肯付钱,我什么都愿意做。不用 ai 早就自己卷自己卷到各个层级人员薪资压得非常低。
回复

使用道具 举报

     
发表于 2025-2-7 14:18 来自手机 | 显示全部楼层
andychen 发表于 2025-2-7 14:00
我用的cline还可以

官方deepseek api为啥我一生成代码就卡住,计划挺好的,实施就崩溃。
回复

使用道具 举报

     
发表于 2025-2-7 14:18 | 显示全部楼层
lyzsuper 发表于 2025-2-7 14:08
是不是就嵌入式能苟最久了

好像也苟不了,说不定哪天RAG技术突破了自己能指定开发手册,需求一写直接开发版联调出货
如果树莓派\esp32也算的话,b站和推上都见过几个例子,起码能打辅助位了
回复

使用道具 举报

     
发表于 2025-2-7 14:18 | 显示全部楼层
这几天在弄一些数据格式转换的东西,没什么难度,也只有deepseek的比较好;
其他chatgpt、豆包、qwenlm给的都是没有考虑兼容性的
回复

使用道具 举报

     
发表于 2025-2-7 14:20 来自手机 | 显示全部楼层
coldhot3 发表于 2025-2-7 13:37
推荐啥,cursor还是vsc配上啥插件?

我都是用文本编辑器

我司连不了外网,公司自己搞的llm用起来麻烦我还没用过,所以我都是手机问完llm再发邮箱。毕竟写代码不算工作量,我去年只写了不到5000行。这个需要等正经码农的建议。
回复

使用道具 举报

     
发表于 2025-2-7 14:20 | 显示全部楼层
毕竟r1的codeforce能排前3.7%了,至少已经比一般通过程序员强不少了
回复

使用道具 举报

     
发表于 2025-2-7 14:21 | 显示全部楼层
面向对象编程-》面向搜索引擎编程-》面向AI编程(new)

cursor对码农的提升非常大。
回复

使用道具 举报

发表于 2025-2-7 14:23 | 显示全部楼层
凌晨的时候ds非常快,白天感觉确实在限流
回复

使用道具 举报

     
发表于 2025-2-7 14:23 来自手机 | 显示全部楼层
R.I.P 发表于 2025-2-7 13:38
我自己之前绝大多数使用都只是当作高级点的文档用,一般就是指明用某某库的某某函数干啥,让给个小例子

...

我还没尝试过思维链写代码,感觉不用思维链已经很牛逼了。可能我遇到的问题都不复杂,我每次也都会先把框架搭好问题分解好,再一个功能一个功能让它写,所以能完成的很好。

我不是超能力者,虽然能看懂简单代码,但你让我写我是写不出来的,得查语法查文档查半天
回复

使用道具 举报

发表于 2025-2-7 14:28 来自手机 | 显示全部楼层
CrayS1 发表于 2025-2-7 14:21
面向对象编程-》面向搜索引擎编程-》面向AI编程(new)

cursor对码农的提升非常大。 ...

要充钱么?

—— 来自 HUAWEI LIO-AL00, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
 楼主| 发表于 2025-2-7 15:04 来自手机 | 显示全部楼层
御坂MKII 发表于 2025-2-7 14:07
quick selection 这种放现在应该算签到了吧

确实,知道要写的话总能写对的,但是这种又是人类最懒得写的东西之一

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-7 15:17 | 显示全部楼层
码农表示震撼最大的还是3.5那一波, prompt好的话是从0到有的突破, 后续最大的震撼是ds-v3, 因为国产+信息差变小+prompt需求不高导致了危机感;
现在早就躺平了, d师傅和o师傅都很强, 都吊打我, 连豆/q师傅都能来踩我两脚的感觉了
回复

使用道具 举报

     
发表于 2025-2-7 15:26 | 显示全部楼层
回错贴了
回复

使用道具 举报

     
发表于 2025-2-7 15:37 | 显示全部楼层
lyzsuper 发表于 2025-2-7 14:08
是不是就嵌入式能苟最久了

嵌入式无非依赖硬件,硬件相关的手册,代码范例,还没有广泛的被AI学习过,一旦有人有意识的把嵌入式的知识灌给AI——我怀疑现在厂商就已经在这么做,毕竟他们需要给你一个人工技术支持解决问题,这个技术支持不就是人肉AI。
回复

使用道具 举报

     
发表于 2025-2-7 15:49 | 显示全部楼层
bcxzzz 发表于 2025-2-7 14:28
要充钱么?

—— 来自 HUAWEI LIO-AL00, Android 12上的 S1Next-鹅版 v2.5.4

众所周知,氪金才能变强
回复

使用道具 举报

     
发表于 2025-2-7 15:50 | 显示全部楼层
bcxzzz 发表于 2025-2-7 14:28
要充钱么?

—— 来自 HUAWEI LIO-AL00, Android 12上的 S1Next-鹅版 v2.5.4

众所周知,氪金才能变强
回复

使用道具 举报

     
发表于 2025-2-7 15:50 | 显示全部楼层
bcxzzz 发表于 2025-2-7 14:28
要充钱么?

—— 来自 HUAWEI LIO-AL00, Android 12上的 S1Next-鹅版 v2.5.4

众所周知,氪金才能变强
回复

使用道具 举报

     
发表于 2025-2-7 15:57 | 显示全部楼层
天地一机成化育 发表于 2025-2-7 13:31
搜索引擎就只能输入几个关键词和几种简单语法,  比AI的用法简单几个数量级了 ...

对,所以要反复尝试不同的搜索词,还要能快速从大量的网页中检索出有用信息,这是需要练的,要不然我为什么说这个是技能。
回复

使用道具 举报

     
发表于 2025-2-7 16:03 | 显示全部楼层
之前丢了几道线性代数的题让D指导做,像求个矩阵特征值特征向量的能做出来,稍复杂一点的证明题就无限loop了,不过能做这个感觉已经很厉害了
回复

使用道具 举报

     
发表于 2025-2-7 18:23 | 显示全部楼层
基本农田 发表于 2025-2-7 13:37
提取关键词是一种技能,AI的作用就是让用户能用自然语言进行搜索。AI只要能实现不会的时候不胡编就能取代 ...

怎么会,没有搜索引擎在互联网上XJB漫游,我就找不到泥潭这样完全无法用LLM理解概括输出内容的地方

LLM无论是哪一边出品的模型,都是用出品方和内容审查人士过滤了一遍思想和观点输出内容的硅喇叭

不会用搜索引擎的人充其量只能是新时代只会复读和咀嚼AI一百三十七手烂屎,没有自己思想能力的容器贱民罢了

评分

参与人数 1战斗力 +1 收起 理由
希望之花 + 1 硅喇叭形象

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-7 19:46 | 显示全部楼层
还在摸索ai中,只说说到目前为止的使用经验。
有了ai之后,我搜索的需求降了80%以上,比如查询官方文档,**小小的常见问题,小的代码块,小脚本,这些基本已经可以取代搜索引擎;
在实现一些跟项目紧密相关的功能模块时,ai经常能给出一些出乎意料的思路,比我自己想的要好;
比较大的功能还不行,得仔细拆分功能,如果把大的需求直接丢给ai,最后会调得心浮气躁甚至火冒三丈
deepseek还没有试过, 不过之前ai给的代码基本都不能直接拿来用,需要改改才行,但即使如此也省了很多功夫。
我觉得ai稍稍拉高了我能力的上限,大约能有1.2x吧
回复

使用道具 举报

发表于 2025-2-7 19:54 | 显示全部楼层
AlphardAlSheya 发表于 2025-2-7 16:03
之前丢了几道线性代数的题让D指导做,像求个矩阵特征值特征向量的能做出来,稍复杂一点的证明题就无限loop ...

他可以思考十几分钟的,你可以等着
回复

使用道具 举报

     
发表于 2025-2-7 20:21 | 显示全部楼层
本帖最后由 andychen 于 2025-2-7 20:23 编辑
coldhot3 发表于 2025-2-7 14:18
官方deepseek api为啥我一生成代码就卡住,计划挺好的,实施就崩溃。

我用R1做plan,act切到v3

r1可以做一些构造之类的工作,写函数之类的粗活v3够用了,另外r1的cot部分可以用来参考思路和做v3的提示语

写注释,debug和优化之类的我看别人用过,我自己穷酸闲token用太多就没试过
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-7 20:42 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2025-2-7 20:55 | 显示全部楼层
d师傅教了我从0开始写脚本,我是从user.js是什么东西开始问的。d师傅最近几天辛苦了,什么git使用流程、github fork是什么意思、docker是干嘛的、网页开控制台能干嘛,通通告诉我了。

论坛助手,iPhone
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 03:02 , Processed in 0.178707 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表