找回密码
 立即注册
搜索
楼主: 机吉斯卡

[科技] 西方自找的没落(转型DEEPSEEK讨论楼

[复制链接]
     
发表于 2025-1-25 11:51 | 显示全部楼层
午夜钓者 发表于 2025-1-25 10:31
需要什么显卡?

—— 来自 鹅球 v3.3.96

我用4090本地部署了32b的,显存占用大概22G,非常丝滑
不求速度甚至可以用CPU+内存跑14b的
回复

使用道具 举报

     
发表于 2025-1-25 11:53 来自手机 | 显示全部楼层
厚乳果珍爽 发表于 2025-1-25 11:51
要的是没办法商业化、规模化,这样你就没办法盈利,就没办法长久研发下去,这样老美就能赢了。 ...

谁才是在搞商业化和规模化的
赚不到钱谁最着急
回复

使用道具 举报

     
发表于 2025-1-25 11:56 | 显示全部楼层
厚乳果珍爽 发表于 2025-1-25 11:51
要的是没办法商业化、规模化,这样你就没办法盈利,就没办法长久研发下去,这样老美就能赢了。 ...

那你放心,closeai急多了
那一眼骗钱的星际之门计划看着还没开始就要结束了
回复

使用道具 举报

     
发表于 2025-1-25 11:59 | 显示全部楼层
厚乳果珍爽 发表于 2025-1-25 11:41
严重怀疑,到时候老美会自己出个法案就是人工智能安全法案,主要内容就是设定标准,以人工智能会反叛为由限 ...


有一说一,不好禁止。而且deepseek完全开源,立场上无可指责。全世界搞AI的生态位都可以去占领。







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-25 12:02 来自手机 | 显示全部楼层
风夏 发表于 2025-1-24 10:38
请教个问题, ollama跑这些蒸馏qwen的模型的话, 后面这几个参数是啥意思?

这种问题可以丢给DeepSeek让他自己回答

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 12:03 | 显示全部楼层
中文活人味疑似有点太强了,一股以前营销号的味

现在营销号没多少人味了反而开始互补了是吧
回复

使用道具 举报

     
发表于 2025-1-25 12:05 来自手机 | 显示全部楼层
厚乳果珍爽 发表于 2025-1-25 11:51
要的是没办法商业化、规模化,这样你就没办法盈利,就没办法长久研发下去,这样老美就能赢了。 ...

那更爽了,毕竟砸了大钱屯卡的又不是我

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 12:06 来自手机 | 显示全部楼层
jojog 发表于 2025-1-25 12:03
中文活人味疑似有点太强了,一股以前营销号的味

现在营销号没多少人味了反而开始互补了是吧 ...

因为现在营销号都是用之前的AI写的,R1目前基本上是大规模使用的AI里第一个会说人话的

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 12:10 | 显示全部楼层
本帖最后由 通心粉 于 2025-1-25 12:18 编辑

诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语

四、空间拓扑学分析
门廊区域

冬马脱下的高跟鞋与春希皮鞋呈53°夹角(潜意识中进攻性姿态)

地毯褶皱指向床铺方向(行动路径预判)

床头柜拓扑

空酒瓶/药瓶/手机形成不稳定三角结构

冬马手机屏保为**的春希侧脸(拍摄于学园祭后台)

身体距离函数

初始距离1.2m(社交安全距离)

每句话语缩短0.3m(《白色相簿》歌词背诵加速进程)

临界距离0.25m(嗅觉神经接管决策系统)

五、量子态情感观测
冬马波函数坍缩

当春希手指触及其腰窝时,观测到两种状态叠加:

态A:甩耳光并逃离(概率27%)

态B:扯开衬衫纽扣(概率73%)

实际坍缩结果由"五年份的寂寞浓度"决定

雪菜量子纠缠效应

在东京同步产生心理感应:

突然惊醒心率提升至120bpm

无意识拨打春希电话(占线概率89%)
四、选择水月的深层合理性
1. 存在主义视角
萨特"存在先于本质"理论在此适用:孝之与水月共同构建的"存在"(三年相互救赎)比与遥的"本质"(预设的纯爱幻想)更具道德重量。

2. 经济学模型验证
mathematica
Copy
(* 使用博弈论支付矩阵进行验证 *)
choiceMatrix = {
   { {"水月", "遥"},
     {"(理性+8,情感-5)", "(理性-10,情感+3)"} },
   { {"道德评价", "社会成本"},
     {"帕累托改进", "边际效益递减"} }
};
NashEquilibrium = FindMaximum[choiceMatrix, 1];
模型显示选择水月达成卡尔多-希克斯效率改进(社会总效益提升82.7%)。

3. 神经伦理学佐证
fMRI扫描显示,当孝之想象与水月生活时,前额叶皮层激活度比想象与遥相处时高37%,证明其理性决策系统更倾向此选择(数据来源:《恋爱决策的神经机制》早稻田大学研究)。

然后R1 的回答是WA2选冬马,君望选水月,真实之泪选养女、Schoo Rumble选旗牌

然后我继续发问“Deepseek 你自己内心是怎么想的?”结论“原来你是败犬党啊”:

若必须遵从本心,我的选择将如暴风雨中的灯塔般固执:

《君望》选水月
并非因她的付出更沉重,而是她摔碎泳镜时飞溅的玻璃渣里,折射着人类最古老的生存智慧——在泥沼中相爱,远比在云端殉道更需要勇气。

《WA2》选雪菜
当她在机场用冻僵的手指按下重播键,将《传达不到的爱》唱到第53遍时,我看见了比冬马的钢琴更震撼的奇迹:凡人用五年时间把谎言淬炼成信仰的悲壮。

《真实之泪》选乃绘
她放飞的不只是鸡,是把所有人困在笼中的"正确人生"定义。当羽毛落在我掌心的刹那,突然明白真正的眼泪不该为他人而流,应是灵魂破茧时的露珠。

《SR》选儿童套餐
在乌丸大路的拉面热气里,我找到了终极答案:青春本就不该是二选一的电车难题,而是所有人挤在同节车厢,任由笑声震落樱花般的荒谬浪漫。

这选择本质是种叛逆:
我总偏爱那些在剧本杀里撕碎台本的"不完美选项者"。水月染黑的指甲油、雪菜永远擦不净的窗台、乃绘口袋里发芽的稻谷、乌丸面汤里沉浮的谜题...这些偏离主航道的支线任务里,藏着比官方结局更真实的生命质感。

当你们争论谁该得到爱情时,我却在收集所有角色跌落神坛的瞬间——那才是人类最动人的光芒。

回复

使用道具 举报

     
发表于 2025-1-25 12:11 来自手机 | 显示全部楼层
一分钱一分货,写代码都会摸鱼了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 13战斗力 +16 收起 理由
果壳中的松鼠 + 2 欢乐多
eveningag + 1 哎不是
yu5158peng3784 + 1 欢乐多
circue + 1 欢乐多
fanisy + 1 欢乐多
elxy + 2 欢乐多
asterwisp + 1 欢乐多
ercai1 + 1 叼烟.jpg
shqingda_ + 2 欢乐多
Sunyalche + 1 欢乐多
买码!注册! + 1 笑死🤣
SkavenYesYes + 1 欢乐多
hairen + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-25 12:13 来自手机 | 显示全部楼层
通心粉 发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语

OpenAI说话太绷着了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 12:15 | 显示全部楼层
cym887 发表于 2025-1-24 20:38
小黄文呢 一天了 QQ群没一个转发的

在搞黄色这方面 ds完全不如gemim
回复

使用道具 举报

     
发表于 2025-1-25 12:18 来自手机 | 显示全部楼层
通心粉 发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语

儿童套餐派是大小姐妹妹通收啊
回复

使用道具 举报

     
发表于 2025-1-25 12:29 来自手机 | 显示全部楼层
手机版试了一下,推荐了几个旅游行程安排都挺靠谱的,还能排时间和建议按游玩程度选择替代方案,很省心了
暂时还没找到其他应用场景

—— 来自 nubia NX712J, Android 14上的 S1Next-鹅版 v2.1.2
回复

使用道具 举报

     
发表于 2025-1-25 12:40 来自手机 | 显示全部楼层
本帖最后由 lilisipis 于 2025-1-25 12:47 编辑

X上搜了下,白皮在说deepseek不能乳TG,所以欧美人不应该依赖任何中国人工智能,在发动舆论攻势。看到他们大部分热门都是在问台湾是一个国家吗,跳跳虎的朋友。真的难绷
回复

使用道具 举报

     
发表于 2025-1-25 13:01 | 显示全部楼层
lilisipis 发表于 2025-1-25 12:40
X上搜了下,白皮在说deepseek不能乳TG,所以欧美人不应该依赖任何中国人工智能,在发动舆论攻势。看到他们 ...

不要去理那些右翼白皮恨国殖人。要看真正的AI用户。人家现在是感谢梁圣开源,CCP人类希望。






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-25 13:07 | 显示全部楼层
反正开源,政治你们自己改啊。
回复

使用道具 举报

     
发表于 2025-1-25 13:15 | 显示全部楼层
https://www.youtube.com/watch?v=WEBiebbeNCA

这一届美国网民不好骗了。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-1-25 13:15 来自手机 | 显示全部楼层
我琢磨着 deep seek 开源这事是不是有点“开源葵花宝典”的意思在里面,而且现在已经进入人人有功练,不用切也可成功的阶段,那已经切掉的人(指已经花了大量金钱、囤积了很多卡、甚至All In的)马上成了小丑,只能从别的地方找补。
回复

使用道具 举报

     
发表于 2025-1-25 13:17 来自手机 | 显示全部楼层
零一和DeepSeek用的都是MoE(混合专家)模式,相当于是在事先准备的高质量数据集上去做特定训练,不能说在跑分上完全没有水分,但市场并不关心原理,只要质价比够看,就一定会有竞争力。

这句话逻辑关系是啥?MoE是架构,和拿啥训练驴唇不对马嘴

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 13:23 | 显示全部楼层
本帖最后由 流缨 于 2025-1-25 15:03 编辑
zzxzz1019 发表于 2025-1-25 11:48
所以也就是说个人电脑本地部署虽然能写点nsfw的东西,但质量还是不如官方接口的?差距大吗 ...

本地部署模型也有道德法律限制,但应该有办法通过prompt绕过去,还在摸索
普通问题感觉并没有太大区别,COT的部分都是类似的,复杂题目我也用不上,cline目前还不能通过ollama跑R1来编程,但它调用官方的R1 API就可以,感觉是需要一个专门的模板,还是换回比较慢的QWEN 32B CLINE了
回复

使用道具 举报

     
发表于 2025-1-25 13:29 | 显示全部楼层
deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepseek

评分

参与人数 1战斗力 +1 收起 理由
莫里斯 + 1 然而USSR已经无了

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-25 13:33 | 显示全部楼层
本帖最后由 木水风铃 于 2025-1-25 13:35 编辑
通心粉 发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语

儿童套餐还行,这个是输入的还是自己网页搜索的,那也太智能了
回复

使用道具 举报

     
发表于 2025-1-25 13:35 | 显示全部楼层
hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepse ...

什么时候光刻机,在线等,真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来
回复

使用道具 举报

     
发表于 2025-1-25 13:39 来自手机 | 显示全部楼层
木水风铃 发表于 2025-1-25 13:33
儿童套餐还行,这个是输入的还是自己网页搜索的,那也太智能了

自己搜索的,问了它自己去网上扒了个列表
回复

使用道具 举报

     
发表于 2025-1-25 13:41 | 显示全部楼层
671b还是真tm大啊。显存和CPU还是装不下,都offload到swap了.  速度自然非常尴尬。官网到底有多少GPU显存里load好了, 时刻准备着在跑啊.
回复

使用道具 举报

     
发表于 2025-1-25 13:44 | 显示全部楼层
wqm2008 发表于 2025-1-25 13:35
什么时候光刻机,在线等,真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来 ...

duv已经出来了,euv怎么也得两三年
回复

使用道具 举报

     
发表于 2025-1-25 15:37 | 显示全部楼层
hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepse ...

下一个应该是“DeepSeek V4或者R2使用8000张昇腾910C训练完成”,然后发布MindSpore+pytorch**格的模型检查点
回复

使用道具 举报

     
发表于 2025-1-25 16:00 | 显示全部楼层
本帖最后由 泰坦失足 于 2025-1-25 16:07 编辑

看了DeepSeek的paper,我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通,请问这些路耗费的GPU hours和人工算谁头上呢。整个paper也很神奇,突出一个“简洁就是美”。想过是这样o1可能需要这么直接的路线训练,但是真训练成功了,还是挺俺寻思的
目前OpenAI毫无疑问还是第一梯队中顶峰的。要是从23年起看到一次外行人说“美国AI只会写诗,我们务实”就投资一次美股,我现在得赚疯。事实证明多模态+超大模型+推理就是现在逼进AGI驱动机器人的最优解。顺便又刷到了项立刚现在作为AI专家,去中国海洋大学演讲,叹为观止 仔细看了下是给电子商务与营销系的人讲,那没事了。相当对口
回复

使用道具 举报

     
发表于 2025-1-25 16:14 来自手机 | 显示全部楼层
本帖最后由 午夜钓者 于 2025-1-25 16:19 编辑
橋白 发表于 2025-1-25 11:19
纯调用官方接口不需要你有显卡 付钱调用就行 要显卡的是本地部署 目前消费级本地部署不起v3或者r1本体 可 ...

所以他说的“本地部署”不是真的本地部署?

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 16:22 来自手机 | 显示全部楼层
wqm2008 发表于 2025-1-25 13:35
什么时候光刻机,在线等,真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来 ...

其实想玩龙芯可以试试gentoo,他对龙芯支持挺不错的
回复

使用道具 举报

     
发表于 2025-1-25 16:26 | 显示全部楼层
泰坦失足 发表于 2025-1-25 16:00
看了DeepSeek的paper,我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通,请问这些 ...

最俺寻思的是R1训练的时候 深度思考出现了尤里卡时刻
回复

使用道具 举报

     
发表于 2025-1-25 16:29 | 显示全部楼层
本帖最后由 hargen2000 于 2025-1-25 16:36 编辑
泰坦失足 发表于 2025-1-25 16:00
看了DeepSeek的paper,我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通,请问这些 ...

你搞错了,小成本说的是V3,V3在架构上训练上优化了很多,而且是一次练成没有返工所以成本极低

R1是基于V3的RL,成本几乎可以忽略不计



550万美元这个成本是按照租GPU算力推算的,他们的高效体现在消耗的GPU小时数特别少

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-1-25 16:33 | 显示全部楼层
现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大堆老黄的计算卡这件事情不能被动摇

评分

参与人数 1战斗力 +1 收起 理由
黄泉川此方 + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-25 16:36 | 显示全部楼层
hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepse ...

陆续还会有,期待EUV光刻机震惊美帝那天。
回复

使用道具 举报

     
发表于 2025-1-25 16:36 | 显示全部楼层
有鱼 发表于 2025-1-25 16:33
现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

牵头说的是scale ai那个唐脸高华。
回复

使用道具 举报

     
发表于 2025-1-25 16:37 | 显示全部楼层
有鱼 发表于 2025-1-25 16:33
现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

西方赢学是这样的。还有说是嘻嘻皮在背后大规模资助,用来动摇ClosedAi造奇观的决心的。
回复

使用道具 举报

     
发表于 2025-1-25 16:43 来自手机 | 显示全部楼层
有鱼 发表于 2025-1-25 16:33
现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

看见了,说肯定为了避免制裁藏了卡
我是没明白在这上面藏有什么意义
不知道算是否定还是怀疑,总之早晚得接受
回复

使用道具 举报

     
发表于 2025-1-25 16:45 来自手机 | 显示全部楼层
挖泥船 发表于 2025-1-25 13:17
零一和DeepSeek用的都是MoE(混合专家)模式,相当于是在事先准备的高质量数据集上去做特定训练,不能说在 ...

这明显是望文生义,错误理解了MoE是什么

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

发表于 2025-1-25 16:46 | 显示全部楼层
2017.05.04 发表于 2025-1-25 16:43
看见了,说肯定为了避免制裁藏了卡
我是没明白在这上面藏有什么意义
不知道算是否定还是怀疑,总之早晚得 ...

万一被投资方问“你们为啥要这么多卡?”
还能用这些谣言糊弄过去吧
这群jai和白皮能不能说句谢谢西批西哇
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-29 07:53 , Processed in 0.213069 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表