找回密码
 立即注册
搜索
查看: 3606|回复: 21

[科技] DEEPSEEK R1的回答本质上是不是已有知识的整合

[复制链接]
发表于 2025-2-22 10:27 | 显示全部楼层 |阅读模式
之前看了讲DEEPSEEK MATH的视频,里面讲模型训练的过程,是从网上某个解题数据集提炼出数据来训练模型,这个过程实际和人刷题类似,只是大模型刷的题量更大,题型更多,大模型给出的解题过程本质上来说实际是已有解题过程的排列组合。于是推测R1也是类似的训练过程,给出的推理结果可能也是已有训练数据的组合。
回复

使用道具 举报

     
发表于 2025-2-22 10:33 | 显示全部楼层
还是“大语言”模型啊。

不过绝大多数我们认为是创造性的工作也还就是对已有知识整合罢了
回复

使用道具 举报

发表于 2025-2-22 10:34 | 显示全部楼层
对啊,自己不会验证,但是听懂人话的能力强了
回复

使用道具 举报

发表于 2025-2-22 10:48 | 显示全部楼层
粗略的说,是的,LLM通过训练获得的回答能力,内蕴了海量文本中已有知识。

区别在于,对于知识的定义,LLM只知道词和词之间的联系和排列方式,并不知道知识本身。LLM可以通过程序性的反思(思维链),补齐部分推导推理的可靠性,但本质上他没有知识这个概念。
按照这个定义,“苹果是一种水果”是一个概率极大的知识,“坦克是一只猫”是一个概率很小的知识。
回复

使用道具 举报

发表于 2025-2-22 10:50 来自手机 | 显示全部楼层
差不多,不过整合这个动作本身也是知识
回复

使用道具 举报

     
发表于 2025-2-22 10:54 | 显示全部楼层
谁都不能无中生有,更加别说ai
回复

使用道具 举报

发表于 2025-2-22 11:00 来自手机 | 显示全部楼层
我的感觉是目前还没有到创造新东西的程度,现阶段就是一个更高级的搜索引擎,传统的搜索引擎你得知道搜什么关键字,得学会过滤信息。用户对于不太了解的领域,很难给的出准确的关键字,筛选过滤就更耗时了。现在ai最大的作用就是你可以用更模糊的语言向它描述需求,ai能较为准确的提取关键字,并且替你做筛选过滤。更进一步的功能是它还可以给出一些建议,比如,有时候我问他一个问题的方案a如何实现,它不但给出方案a的实现和例子,还能给出优缺点,偶尔还能说其实现在已经有更新更优的方案b
回复

使用道具 举报

     
发表于 2025-2-22 11:04 | 显示全部楼层
一直都是这样,但整合知识本身就是很高级的能力,我现在想实现什么简单的脚本全让AI写,写出来不对就让他改到对为止,以前哪有这么好的体验
更不用说很多创新就是基于对现状深刻的理解之上,通过AI调研新领域舒服得很
回复

使用道具 举报

发表于 2025-2-22 11:05 来自手机 | 显示全部楼层
本帖最后由 wbtsy 于 2025-2-22 11:25 编辑

语言(或者说包括手语、表情等表达)是思想的唯一外在体现。人的思想再复杂、情感再丰富,也只能通过语言来传达(甚至有些哲学理论认为人的思想会受到语言的影响,比如Sapir-Whorf假设)。

人类的知识基本上是由语言记录和组成的。所以如果完美把握了语言的规律,即便没有思想,外人也无法分辨。

就像假设面对外星人的乱码语言,不需要破译乱码的含义。只是单纯总结整个外星人文化中,乱码之间组合出现的频率和规律,只无脑给出概率最高的乱码,也可以和外星人沟通。

我觉得这个就是大语言模型显得更智能的原因。电脑只是在玩文字迷题,外人看来它仿佛有了思想。

评分

参与人数 1战斗力 +1 收起 理由
苏西踩我了 + 1

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-22 11:06 | 显示全部楼层
所以在公开资料少、模糊、不确定性高的区域就不太行了
回复

使用道具 举报

     
发表于 2025-2-22 11:08 | 显示全部楼层
是的,所以这就是为什么说很多人觉得LLM这条技术路线不可能诞生AGI的原因。
回复

使用道具 举报

     
发表于 2025-2-22 11:14 | 显示全部楼层
中文屋问题
回复

使用道具 举报

发表于 2025-2-22 11:14 来自手机 | 显示全部楼层
魔法煎饼 发表于 2025-2-22 11:08
是的,所以这就是为什么说很多人觉得LLM这条技术路线不可能诞生AGI的原因。 ...

谁知道呢,也许10年后就AGI来了,也许再过几十年,ai也还是个能听懂人话的管家水平
回复

使用道具 举报

头像被屏蔽
发表于 2025-2-22 11:15 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-22 11:31 | 显示全部楼层
现在的问题是d老师他思维链上要是有缺失的信息他会自己瞎几把补,这部分感觉有点像是格斗游戏的回滚机制?根据前后帧数据补充因为数据延迟而丢失的操作部分,但是格斗游戏人家是有限选择的啊,d老师会从他的知识库里东拉西扯瞎**补啊,他不管真假的,所有空给你填上就算答题完毕
回复

使用道具 举报

     
发表于 2025-2-22 12:44 来自手机 | 显示全部楼层
ai可以比人“全能,高效”。现在的人类社会,人的能力强弱实际上是ai能发挥多大能力的基座。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-22 12:57 | 显示全部楼层
让人只接触文字,不从环境中接受其他任何信息,一样会人云亦云,甚至被错误信息干扰,胡言乱语
如果AI不仅接触文字,能接受环境信息,与环境互动来不断修正自己的想法,那也许就会变得更有创造力了
一个想法不一定对
回复

使用道具 举报

     
发表于 2025-2-22 13:01 来自手机 | 显示全部楼层
我问了他乌龟服的pfquest在大地图上面的锚点弹出框怎么调整大小,给我的答案不好用,再问就服务器繁忙了
回复

使用道具 举报

     
发表于 2025-2-22 13:18 来自手机 | 显示全部楼层
人所谓的创造性也是基于人本身的经验推理抽象出来的结论,推理抽象本身就是神经元和电信号在交互。夏虫不可语冰,人的创造力再牛逼也没办法创造认知以外的东西,从这个角度来说人和大模型也没有本质上的区别。

—— 来自 nubia NX713J, Android 14上的 S1Next-鹅版 v2.5.3-play
回复

使用道具 举报

     
发表于 2025-2-22 13:22 | 显示全部楼层
走来走去 发表于 2025-2-22 11:14
谁知道呢,也许10年后就AGI来了,也许再过几十年,ai也还是个能听懂人话的管家水平 ...

在说AGI要来之前,还是先把对应的技术路线提出来。
目前的这个,论文已经出了几十年了。
回复

使用道具 举报

     
发表于 2025-2-22 13:45 | 显示全部楼层
哪有那么多本质
回复

使用道具 举报

     
发表于 2025-2-22 13:48 来自手机 | 显示全部楼层
现在媒体把ds吹太过了,搞得很多人觉得他是无所不能的。甚至政府宣传也在往这方面靠。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 06:42 , Processed in 0.113125 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表