找回密码
 立即注册
搜索
查看: 25362|回复: 123

[欢乐] Day 5: 高性能文件系统 开源周结束,DS才是无可争议的OpenAI

[复制链接]
     
发表于 2025-2-21 12:50 | 显示全部楼层 |阅读模式
本帖最后由 moekyo 于 2025-2-28 12:02 编辑

真正的OpenAI.jpg


day 1

https://github.com/deepseek-ai/FlashMLA

day 2

https://github.com/deepseek-ai/DeepEP

https://github.com/deepseek-ai/DeepGEMM
day 4

https://github.com/deepseek-ai/DualPipe
https://github.com/deepseek-ai/eplb
https://github.com/deepseek-ai/profile-data

day 5

https://github.com/deepseek-ai/3FS


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 2战斗力 +2 收起 理由
偽物 + 1 好评加鹅
黄泉川此方 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-21 12:55 | 显示全部楼层
是不是5个交易日分别1个……
回复

使用道具 举报

     
发表于 2025-2-21 13:25 来自手机 | 显示全部楼层
悲观主义者大呼小叫
乐观主义者提前做空

—— 来自 鹅球 v3.3.96

评分

参与人数 2战斗力 +2 收起 理由
偽物 + 1 好评加鹅
空蝉。 + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-21 13:50 | 显示全部楼层
该做多还是做空,只有幻方知道了
回复

使用道具 举报

     
发表于 2025-2-21 13:50 来自手机 | 显示全部楼层
希望最后一天来个大的,发布新模型

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

发表于 2025-2-21 13:57 来自手机 | 显示全部楼层
他们想开源自己的一些必要的infra库把,之前就说想开但是人手不够开不了,把代码啥说明都没有地放出来的开源国内公司品鉴的已经很多了,deepseek明显不想这样

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
 楼主| 发表于 2025-2-21 13:59 | 显示全部楼层
SevenYuan23 发表于 2025-2-21 13:50
希望最后一天来个大的,发布新模型

—— 来自 鹅球 v3.3.96

虽然我也想,但是这个明显没可能吧
回复

使用道具 举报

     
发表于 2025-2-21 14:20 来自手机 | 显示全部楼层


多模态要来了?

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-21 14:22 | 显示全部楼层
SevenYuan23 发表于 2025-2-21 13:50
希望最后一天来个大的,发布新模型

—— 来自 鹅球 v3.3.96

传闻改进的r2快出来了
回复

使用道具 举报

     
发表于 2025-2-21 14:23 | 显示全部楼层
SevenYuan23 发表于 2025-2-21 14:20
多模态要来了?

—— 来自 鹅球 v3.3.96

多模态的话,不能算small了吧
回复

使用道具 举报

     
 楼主| 发表于 2025-2-21 14:28 | 显示全部楼层
These humble building blocks in our online service have been documented, deployed and battle-tested in production.

这个怎么都和模型本体无关吧?
回复

使用道具 举报

     
发表于 2025-2-21 14:38 | 显示全部楼层
之前不是有黑子说只开源权重模型不算开源嘛,估计要把训练框架开源?
回复

使用道具 举报

     
发表于 2025-2-21 14:40 | 显示全部楼层
还有可能是把联网搜索的机制开源
回复

使用道具 举报

     
发表于 2025-2-21 14:46 | 显示全部楼层
大的要来了.JPG
时间差不多喽
回复

使用道具 举报

     
发表于 2025-2-21 14:49 | 显示全部楼层
西大某伪"open"公司瑟瑟发抖
回复

使用道具 举报

     
发表于 2025-2-21 15:01 | 显示全部楼层
我还没上车!我还没上车啊!
回复

使用道具 举报

发表于 2025-2-21 16:52 来自手机 | 显示全部楼层
追着锤啊

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-21 16:53 | 显示全部楼层
这套预告深得美国预期管理精髓
回复

使用道具 举报

     
发表于 2025-2-21 17:09 | 显示全部楼层
不让好好过周末是吧
回复

使用道具 举报

     
发表于 2025-2-21 17:13 | 显示全部楼层
喷了 reddit关于这事的评论下又发了那张do nothing still win的屌图
码打成这样发出来应该没问题吧


reddit帖子地址
https://www.reddit.com/r/LocalLL ... _will_opensource_5/

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-2-21 17:15 | 显示全部楼层
“Open” week
回复

使用道具 举报

     
发表于 2025-2-21 17:22 | 显示全部楼层
如果真的是 infra 那边的,那就真的好好改善了 openai 带起来的假 "open" 的歪风邪气。
回复

使用道具 举报

     
发表于 2025-2-21 17:27 | 显示全部楼层
再补一下 fsf 当初的愿景 https://www.fsf.org/news/fsf-is- ... arning-applications openai就算最开始的那几个模型也不配它公司名里的 open。
回复

使用道具 举报

     
发表于 2025-2-21 17:32 来自手机 | 显示全部楼层
说了是生产环境的组件,应该是infra的一些实现细节,利好各个模型云服务商部署的。新模型应该没有。
不过我就想看closeai怎么反应,之前好像搞了10天直播吧应该?结果除了deep research有点花头之外都是鸡肋,来看真正的源神怎么操作的。

— from S1 Next Goose v3.3.96
回复

使用道具 举报

     
发表于 2025-2-24 11:12 来自手机 | 显示全部楼层
第一天:flashmla
https://github.com/deepseek-ai/FlashMLA
你看我说什么来着

— from S1 Next Goose v3.3.96
回复

使用道具 举报

     
 楼主| 发表于 2025-2-24 11:19 | 显示全部楼层
Azcarlo 发表于 2025-2-24 11:12
第一天:flashmla
https://github.com/deepseek-ai/FlashMLA
你看我说什么来着

坏了,DS真的是想全链条地教人手搓AI的
回复

使用道具 举报

     
发表于 2025-2-24 11:21 | 显示全部楼层
moekyo 发表于 2025-2-24 11:19
坏了,DS真的是想全链条地教人手搓AI的

开源生态就是要这么建立的
回复

使用道具 举报

     
发表于 2025-2-24 11:22 来自手机 | 显示全部楼层
《AI创世纪》
第一天,神开源了快速多头注意力代码
...
第六天和第七天神都休息了,因为双休是好的

评分

参与人数 1战斗力 +1 收起 理由
ydsf + 1 伟大

查看全部评分

回复

使用道具 举报

     
 楼主| 发表于 2025-2-24 11:23 | 显示全部楼层
枯风瘦雪 发表于 2025-2-24 11:21
开源生态就是要这么建立的

唯一不爽的就是有可能被日本人学去,但是感觉日本人就算有了这些也造不出来
回复

使用道具 举报

     
发表于 2025-2-24 11:26 | 显示全部楼层
moekyo 发表于 2025-2-24 11:23
唯一不爽的就是有可能被日本人学去,但是感觉日本人就算有了这些也造不出来 ...

梁总都说了,竞争力的关键是对有能力的人的组织方法,要有自信
回复

使用道具 举报

     
发表于 2025-2-24 11:28 | 显示全部楼层
moekyo 发表于 2025-2-24 11:23
唯一不爽的就是有可能被日本人学去,但是感觉日本人就算有了这些也造不出来 ...

传真机也可以跑AI吗

评分

参与人数 1战斗力 +1 收起 理由
阿鲁帕卡 + 1 欢乐多

查看全部评分

回复

使用道具 举报

发表于 2025-2-24 11:30 来自手机 | 显示全部楼层
ds的研发是真的靠的党的领导,外国人学不了的。
回复

使用道具 举报

     
发表于 2025-2-24 11:31 来自手机 | 显示全部楼层
r2呢
回复

使用道具 举报

     
发表于 2025-2-24 11:34 来自手机 | 显示全部楼层
cute 看起来好恶心,模板元编程和 nvgpu 领域知识混到一起的怪胎

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-24 11:52 | 显示全部楼层
突破h800的带宽上限?那皮衣黄的限制不是白做了,限制还得加码
回复

使用道具 举报

发表于 2025-2-24 12:01 | 显示全部楼层
moekyo 发表于 2025-2-24 11:23
唯一不爽的就是有可能被日本人学去,但是感觉日本人就算有了这些也造不出来 ...

日本连个万卡集群都拿不出来,还是算了吧
回复

使用道具 举报

     
发表于 2025-2-24 12:07 来自手机 | 显示全部楼层
openai和老黄会不会哭着给ds送钱求他们别继续开源了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-24 12:09 来自手机 | 显示全部楼层
ryanghj 发表于 2025-2-24 12:01
日本连个万卡集群都拿不出来,还是算了吧

未必,中国企业套个皮在海外狂建算力中心绕过美国管制的项目我知道的就不少
回复

使用道具 举报

     
 楼主| 发表于 2025-2-24 12:23 | 显示全部楼层
本帖最后由 moekyo 于 2025-2-24 14:24 编辑
ryanghj 发表于 2025-2-24 12:01
日本连个万卡集群都拿不出来,还是算了吧

你说卡,这家是有的Sakura Internet,但是我不觉得日本的瓶颈是卡,起码当下这个时间节点,只要给钱,还是卖日本的,它们的瓶颈是日本人本身
回复

使用道具 举报

发表于 2025-2-24 13:48 | 显示全部楼层
orecheng 发表于 2025-2-24 12:09
未必,中国企业套个皮在海外狂建算力中心绕过美国管制的项目我知道的就不少 ...

都是在马来西亚新加坡建的,哪有去日本的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 03:13 , Processed in 0.171751 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表