找回密码
 立即注册
搜索
楼主: cody198879

[科技] deepseek的开源不亚于一次核扩散

[复制链接]
发表于 2025-2-9 03:53 来自手机 | 显示全部楼层
一三五七九 发表于 2025-2-9 00:12
不是看到7900xtx 运行起来和4080 4090差不多么?

我猜是推理,模型推理优化方案挺多的,基于不同平台
回复

使用道具 举报

发表于 2025-2-9 08:34 来自手机 | 显示全部楼层
螺旋的小夜曲 发表于 2025-2-9 02:28
openai倒不了,软银还要加仓呢

恰恰相反 美帝高科技能让孙桑染指 说明西大资本认为closeai不算核心高科技了
回复

使用道具 举报

发表于 2025-2-9 08:37 来自手机 | 显示全部楼层
ds最大的工作还是实现了moe架构吧 推理一次只需要激活5%左右的权重 其需要的算力**降低了 对算力卡的需求也**降低了
回复

使用道具 举报

     
发表于 2025-2-9 08:51 来自手机 | 显示全部楼层
5090虽然炒,但 6万多是漫天报价落地还钱,实际成交是在4万左右

毕竟要看rtx6000ada几个钱,出去生产力,超顶配游戏玩家哪能撑得住需求

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-2-9 09:15 来自手机 | 显示全部楼层
本帖最后由 东龙山 于 2025-2-9 09:20 编辑
crazyt 发表于 2025-2-8 23:34
所谓0到1不是很擅长,是过去底子薄,长期处于追赶阶段。现在厚积薄发,大量领域都处于领先地位了,以后0 ...


从0到1是原创,是高校的事情,但是高校筛选体制有问题。

高校现在筛选的都是密集兑现浅层思考的灌水刷子,并占据了各层帽子,追热点灌水 性价比最高,真硬骨头绕着走。长时间思考深刻问题的,比如张益唐佩雷尔曼这种,是吃亏的,现在差不多生态灭绝。

有人说,等他有了帽子就会做深刻问题,但是打惯了追击战是打不了攻城战的,没有训练到深度思考能力。
回复

使用道具 举报

     
发表于 2025-2-9 09:17 来自手机 | 显示全部楼层
我们这些年的科技进步,主要是工程技术的进步,是海量工程师996的结果。但是学阀总喜欢拿工程技术的进步给自己贴金,他们本职工作-原创突破,表现一坨翔。
回复

使用道具 举报

     
发表于 2025-2-9 09:24 | 显示全部楼层
科技越发展突破越难啊,而且你不做到第一就像突破不是搞笑么?
回复

使用道具 举报

     
发表于 2025-2-9 09:26 | 显示全部楼层
Llama,QWEN (VL),Stable Diffusion, Hunyuan:那我是谁?
回复

使用道具 举报

     
发表于 2025-2-9 09:32 来自手机 | 显示全部楼层
泰坦失足 发表于 2025-2-9 09:26
Llama,QWEN (VL),Stable Diffusion, Hunyuan:那我是谁?

lllma针对训练成本过高吧 小国跟进还挺难的

另外这四个效果都不如闭源(不算闭源毫无兴趣的二次元方向) 这是最大的痛脚 r1则是追上了闭源
不过hunyuan可能能追上闭源可灵 很难说
回复

使用道具 举报

     
发表于 2025-2-9 10:28 来自手机 | 显示全部楼层
东龙山 发表于 2025-2-9 09:15
从0到1是原创,是高校的事情,但是高校筛选体制有问题。

高校现在筛选的都是密集兑现浅层思考的灌水刷子 ...

这又要开始反思了吗

—— 来自 HUAWEI TAH-AN00m, Android 12上的 S1Next-鹅版 v2.2.2.1
回复

使用道具 举报

     
发表于 2025-2-9 10:34 来自手机 | 显示全部楼层
东龙山 发表于 2025-2-9 09:15
从0到1是原创,是高校的事情,但是高校筛选体制有问题。

高校现在筛选的都是密集兑现浅层思考的灌水刷子 ...

你一定很喜欢看耿同学吧

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-9 10:42 来自手机 | 显示全部楼层
一三五七九 发表于 2025-2-9 00:12
不是看到7900xtx 运行起来和4080 4090差不多么?

差不多?远超4080,小超4090,只有32b稍弱于4090。
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-9 10:52 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-9 10:53 来自手机 | 显示全部楼层
东龙山 发表于 2025-2-9 09:15
从0到1是原创,是高校的事情,但是高校筛选体制有问题。

高校现在筛选的都是密集兑现浅层思考的灌水刷子 ...

十来年前的话术口径,可是什么都做不好,只会卷低端行业,搞不了研发去攀中高端呢。
回复

使用道具 举报

     
发表于 2025-2-9 10:55 | 显示全部楼层
moekyo 发表于 2025-2-9 00:27
在s1居然没看说sao通关之后,茅场弄的那个the seed,只不过现实中日本是路边就是了 ...

因为那个the seed看似美好其实屁用没有,日本人还是延续了自己锁区的光荣传统。

哦对现在在播的香格里拉边境,里面那个吹得天下第一3000万玩家的网游,也是个锁区游戏。
回复

使用道具 举报

     
发表于 2025-2-9 11:02 | 显示全部楼层
东龙山 发表于 2025-2-9 09:15
从0到1是原创,是高校的事情,但是高校筛选体制有问题。

高校现在筛选的都是密集兑现浅层思考的灌水刷子 ...

神经网络的基础从上世纪40年代开始,80年代建立了深度学习的理论,之后对AI的研究就没停过。现在的AI大模型是几十年软硬件发展达到一定程度后的质变结果,是100而不是0。
回复

使用道具 举报

     
发表于 2025-2-9 11:04 来自手机 | 显示全部楼层
neptunehs 发表于 2025-2-9 09:32
lllma针对训练成本过高吧 小国跟进还挺难的

另外这四个效果都不如闭源(不算闭源毫无兴趣的二次元方向) ...

别的不说,stable diffusion 1.4开源的时候可没什么能打的文生图闭源模型。甚至可以说是SD1.4掀起了个人运行AI模型的浪潮
回复

使用道具 举报

     
发表于 2025-2-9 12:19 | 显示全部楼层
幽远ghofar 发表于 2025-2-9 10:55
因为那个the seed看似美好其实屁用没有,日本人还是延续了自己锁区的光荣传统。

哦对现在在播的香格里拉 ...

日本人确实是弱智,前不久任天堂不是ban了外卡支付吗
回复

使用道具 举报

     
发表于 2025-2-9 12:27 | 显示全部楼层
rhotov 发表于 2025-2-8 22:22
绕CUDA到底是不是误读啊

当然是…但凡看过deepseek的论文说不出这样的昏话。
回复

使用道具 举报

     
发表于 2025-2-9 12:30 | 显示全部楼层
东龙山 发表于 2025-2-9 09:15
从0到1是原创,是高校的事情,但是高校筛选体制有问题。

高校现在筛选的都是密集兑现浅层思考的灌水刷子 ...

看起来至少你对计算机这个行业的科研完全没有了解
回复

使用道具 举报

     
发表于 2025-2-9 13:38 | 显示全部楼层
所谓的绕过 cuda 只是用 PTX 定制了跨机通信优化
回复

使用道具 举报

     
发表于 2025-2-9 14:03 | 显示全部楼层
rhotov 发表于 2025-2-8 22:22
绕CUDA到底是不是误读啊

只要能异构并行,那绕不绕都不重要了。
之前都是女大一家独大地搞算力,现在可以多家并行,从这点上来说接下来不该投女大而是台积电和asml
回复

使用道具 举报

     
发表于 2025-2-9 14:29 来自手机 | 显示全部楼层
其实主要原因还是推理模型真的太强了,所有第一接触ai的人都被震撼了,我妈和我媳妇觉得完全不可思议,我媳妇里吗感觉很多工作要被淘汰了。
回复

使用道具 举报

     
发表于 2025-2-9 14:38 | 显示全部楼层
幽远ghofar 发表于 2025-2-9 11:02
神经网络的基础从上世纪40年代开始,80年代建立了深度学习的理论,之后对AI的研究就没停过。现在的AI大模 ...

装啥懂哥语言能力的涌现难道还能是0?
回复

使用道具 举报

     
发表于 2025-2-9 15:24 | 显示全部楼层
再孝敬泥潭十块 发表于 2025-2-9 08:37
ds最大的工作还是实现了moe架构吧 推理一次只需要激活5%左右的权重 其需要的算力**降低了 对算力卡的需求也 ...

MoE 不稀奇,高度稀疏又能稳定收敛、极致负载均衡的 MoE 比较稀奇
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 07:15 , Processed in 0.152748 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表