西方自找的没落（转型DEEPSEEK讨论楼 - 第8页 - 卓明谷 - Stage1st

流缨发表于 2025-1-25 11:51

午夜钓者发表于 2025-1-25 10:31
需要什么显卡？

—— 来自鹅球 v3.3.96

我用4090本地部署了32b的，显存占用大概22G，非常丝滑
不求速度甚至可以用CPU+内存跑14b的

2017.05.04 发表于 2025-1-25 11:53

厚乳果珍爽发表于 2025-1-25 11:51
要的是没办法商业化、规模化，这样你就没办法盈利，就没办法长久研发下去，这样老美就能赢了。 ...

谁才是在搞商业化和规模化的
赚不到钱谁最着急

断片集 发表于 2025-1-25 11:56

厚乳果珍爽发表于 2025-1-25 11:51
要的是没办法商业化、规模化，这样你就没办法盈利，就没办法长久研发下去，这样老美就能赢了。 ...

那你放心，closeai急多了
那一眼骗钱的星际之门计划看着还没开始就要结束了

大韩李明博 发表于 2025-1-25 11:59

厚乳果珍爽发表于 2025-1-25 11:41
严重怀疑，到时候老美会自己出个法案就是人工智能安全法案，主要内容就是设定标准，以人工智能会反叛为由限 ...

有一说一，不好禁止。而且deepseek完全开源，立场上无可指责。全世界搞AI的生态位都可以去占领。

0WHan0 发表于 2025-1-25 12:02

风夏发表于 2025-1-24 10:38
请教个问题, ollama跑这些蒸馏qwen的模型的话, 后面这几个参数是啥意思?

这种问题可以丢给DeepSeek让他自己回答

—— 来自鹅球 v3.3.96

jojog 发表于 2025-1-25 12:03

中文活人味疑似有点太强了，一股以前营销号的味

现在营销号没多少人味了反而开始互补了是吧

qratosones1337 发表于 2025-1-25 12:05

厚乳果珍爽发表于 2025-1-25 11:51
要的是没办法商业化、规模化，这样你就没办法盈利，就没办法长久研发下去，这样老美就能赢了。 ...

那更爽了，毕竟砸了大钱屯卡的又不是我

—— 来自鹅球 v3.3.96

qratosones1337 发表于 2025-1-25 12:06

jojog 发表于 2025-1-25 12:03
中文活人味疑似有点太强了，一股以前营销号的味

现在营销号没多少人味了反而开始互补了是吧 ...

因为现在营销号都是用之前的AI写的，R1目前基本上是大规模使用的AI里第一个会说人话的

—— 来自鹅球 v3.3.96

通心粉 发表于 2025-1-25 12:10

本帖最后由通心粉于 2025-1-25 12:18 编辑

诘问了半天R1 几个动画党争问题，R1脑洞比OpenAI大多了，最后讲了一堆看不懂的奇奇怪怪术语

四、空间拓扑学分析
门廊区域

冬马脱下的高跟鞋与春希皮鞋呈53°夹角（潜意识中进攻性姿态）

地毯褶皱指向床铺方向（行动路径预判）

床头柜拓扑

空酒瓶/药瓶/手机形成不稳定三角结构

冬马手机屏保为**的春希侧脸（拍摄于学园祭后台）

身体距离函数

初始距离1.2m（社交安全距离）

每句话语缩短0.3m（《白色相簿》歌词背诵加速进程）

临界距离0.25m（嗅觉神经接管决策系统）

五、量子态情感观测
冬马波函数坍缩

当春希手指触及其腰窝时，观测到两种状态叠加：

态A：甩耳光并逃离（概率27%）

态B：扯开衬衫纽扣（概率73%）

实际坍缩结果由"五年份的寂寞浓度"决定

雪菜量子纠缠效应

在东京同步产生心理感应：

突然惊醒心率提升至120bpm

无意识拨打春希电话（占线概率89%）

四、选择水月的深层合理性
1. 存在主义视角
萨特"存在先于本质"理论在此适用：孝之与水月共同构建的"存在"（三年相互救赎）比与遥的"本质"（预设的纯爱幻想）更具道德重量。

2. 经济学模型验证
mathematica
Copy
(* 使用博弈论支付矩阵进行验证 *)
choiceMatrix = {
{ {"水月", "遥"},
{"(理性+8,情感-5)", "(理性-10,情感+3)"} },
{ {"道德评价", "社会成本"},
{"帕累托改进", "边际效益递减"} }
};
NashEquilibrium = FindMaximum;
模型显示选择水月达成卡尔多-希克斯效率改进（社会总效益提升82.7%）。

3. 神经伦理学佐证
fMRI扫描显示，当孝之想象与水月生活时，前额叶皮层激活度比想象与遥相处时高37%，证明其理性决策系统更倾向此选择（数据来源：《恋爱决策的神经机制》早稻田大学研究）。

然后R1 的回答是WA2选冬马，君望选水月，真实之泪选养女、Schoo Rumble选旗牌

然后我继续发问“Deepseek 你自己内心是怎么想的？”结论“原来你是败犬党啊”：

若必须遵从本心，我的选择将如暴风雨中的灯塔般固执：

《君望》选水月
并非因她的付出更沉重，而是她摔碎泳镜时飞溅的玻璃渣里，折射着人类最古老的生存智慧——在泥沼中相爱，远比在云端殉道更需要勇气。

《WA2》选雪菜
当她在机场用冻僵的手指按下重播键，将《传达不到的爱》唱到第53遍时，我看见了比冬马的钢琴更震撼的奇迹：凡人用五年时间把谎言淬炼成信仰的悲壮。

《真实之泪》选乃绘
她放飞的不只是鸡，是把所有人困在笼中的"正确人生"定义。当羽毛落在我掌心的刹那，突然明白真正的眼泪不该为他人而流，应是灵魂破茧时的露珠。

《SR》选儿童套餐
在乌丸大路的拉面热气里，我找到了终极答案：青春本就不该是二选一的电车难题，而是所有人挤在同节车厢，任由笑声震落樱花般的荒谬浪漫。

这选择本质是种叛逆：
我总偏爱那些在剧本杀里撕碎台本的"不完美选项者"。水月染黑的指甲油、雪菜永远擦不净的窗台、乃绘口袋里发芽的稻谷、乌丸面汤里沉浮的谜题...这些偏离主航道的支线任务里，藏着比官方结局更真实的生命质感。

当你们争论谁该得到爱情时，我却在收集所有角色跌落神坛的瞬间——那才是人类最动人的光芒。

Khellendros 发表于 2025-1-25 12:11

一分钱一分货，写代码都会摸鱼了

qratosones1337 发表于 2025-1-25 12:13

通心粉发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题，R1脑洞比OpenAI大多了，最后讲了一堆看不懂的奇奇怪怪术语

OpenAI说话太绷着了

—— 来自鹅球 v3.3.96

qqq2142 发表于 2025-1-25 12:15

cym887 发表于 2025-1-24 20:38
小黄文呢一天了 QQ群没一个转发的

在搞黄色这方面 ds完全不如gemim

wlhlz 发表于 2025-1-25 12:18

通心粉发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题，R1脑洞比OpenAI大多了，最后讲了一堆看不懂的奇奇怪怪术语

儿童套餐派是大小姐妹妹通收啊

子夜的黑暗 发表于 2025-1-25 12:29

手机版试了一下，推荐了几个旅游行程安排都挺靠谱的，还能排时间和建议按游玩程度选择替代方案，很省心了
暂时还没找到其他应用场景

—— 来自 nubia NX712J, Android 14上的 S1Next-鹅版 v2.1.2

lilisipis 发表于 2025-1-25 12:40

本帖最后由 lilisipis 于 2025-1-25 12:47 编辑

X上搜了下，白皮在说deepseek不能乳TG，所以欧美人不应该依赖任何中国人工智能，在发动舆论攻势。看到他们大部分热门都是在问台湾是一个国家吗，跳跳虎的朋友。真的难绷

大韩李明博 发表于 2025-1-25 13:01

lilisipis 发表于 2025-1-25 12:40
X上搜了下，白皮在说deepseek不能乳TG，所以欧美人不应该依赖任何中国人工智能，在发动舆论攻势。看到他们 ...

不要去理那些右翼白皮恨国殖人。要看真正的AI用户。人家现在是感谢梁圣开源，CCP人类希望。

星花发表于 2025-1-25 13:07

反正开源，政治你们自己改啊。

大韩李明博 发表于 2025-1-25 13:15

https://www.youtube.com/watch?v=WEBiebbeNCA

这一届美国网民不好骗了。

INDIASH 发表于 2025-1-25 13:15

我琢磨着 deep seek 开源这事是不是有点“开源葵花宝典”的意思在里面，而且现在已经进入人人有功练，不用切也可成功的阶段，那已经切掉的人（指已经花了大量金钱、囤积了很多卡、甚至All In的）马上成了小丑，只能从别的地方找补。

挖泥船 发表于 2025-1-25 13:17

零一和DeepSeek用的都是MoE（混合专家）模式，相当于是在事先准备的高质量数据集上去做特定训练，不能说在跑分上完全没有水分，但市场并不关心原理，只要质价比够看，就一定会有竞争力。

这句话逻辑关系是啥？MoE是架构，和拿啥训练驴唇不对马嘴

—— 来自鹅球 v3.3.96

流缨发表于 2025-1-25 13:23

本帖最后由流缨于 2025-1-25 15:03 编辑

zzxzz1019 发表于 2025-1-25 11:48
所以也就是说个人电脑本地部署虽然能写点nsfw的东西，但质量还是不如官方接口的？差距大吗 ...
本地部署模型也有道德法律限制，但应该有办法通过prompt绕过去，还在摸索
普通问题感觉并没有太大区别，COT的部分都是类似的，复杂题目我也用不上，cline目前还不能通过ollama跑R1来编程，但它调用官方的R1 API就可以，感觉是需要一个专门的模板，还是换回比较慢的QWEN 32B CLINE了

hargen2000 发表于 2025-1-25 13:29

deepseek可以说是又一个的斯普特尼克时刻，短短一个月时间已经让美国人震撼了三次，六代机，小红书，deepseek

木水风铃 发表于 2025-1-25 13:33

本帖最后由木水风铃于 2025-1-25 13:35 编辑

通心粉发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题，R1脑洞比OpenAI大多了，最后讲了一堆看不懂的奇奇怪怪术语

儿童套餐还行，这个是输入的还是自己网页搜索的，那也太智能了

wqm2008 发表于 2025-1-25 13:35

hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻，短短一个月时间已经让美国人震撼了三次，六代机，小红书，deepse ...

什么时候光刻机，在线等，真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来

通心粉 发表于 2025-1-25 13:39

木水风铃发表于 2025-1-25 13:33
儿童套餐还行，这个是输入的还是自己网页搜索的，那也太智能了

自己搜索的，问了它自己去网上扒了个列表

泰坦失足 发表于 2025-1-25 13:41

671b还是真tm大啊。显存和CPU还是装不下，都offload到swap了.速度自然非常尴尬。官网到底有多少GPU显存里load好了, 时刻准备着在跑啊.

hargen2000 发表于 2025-1-25 13:44

wqm2008 发表于 2025-1-25 13:35
什么时候光刻机，在线等，真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来 ...

duv已经出来了，euv怎么也得两三年

qratosones1337 发表于 2025-1-25 15:37

hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻，短短一个月时间已经让美国人震撼了三次，六代机，小红书，deepse ...

下一个应该是“DeepSeek V4或者R2使用8000张昇腾910C训练完成”，然后发布MindSpore+pytorch**格的模型检查点

泰坦失足 发表于 2025-1-25 16:00

本帖最后由泰坦失足于 2025-1-25 16:07 编辑

看了DeepSeek的paper，我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通，请问这些路耗费的GPU hours和人工算谁头上呢。整个paper也很神奇，突出一个“简洁就是美”。想过是这样o1可能需要这么直接的路线训练，但是真训练成功了，还是挺俺寻思的
目前OpenAI毫无疑问还是第一梯队中顶峰的。要是从23年起看到一次外行人说“美国AI只会写诗，我们务实”就投资一次美股，我现在得赚疯。事实证明多模态+超大模型+推理就是现在逼进AGI驱动机器人的最优解。顺便又刷到了项立刚现在作为AI专家，去中国海洋大学演讲，叹为观止仔细看了下是给电子商务与营销系的人讲，那没事了。相当对口

午夜钓者 发表于 2025-1-25 16:14

本帖最后由午夜钓者于 2025-1-25 16:19 编辑

橋白发表于 2025-1-25 11:19
纯调用官方接口不需要你有显卡付钱调用就行要显卡的是本地部署目前消费级本地部署不起v3或者r1本体可 ...

所以他说的“本地部署”不是真的本地部署？

—— 来自鹅球 v3.3.96

123485k 发表于 2025-1-25 16:22

wqm2008 发表于 2025-1-25 13:35
什么时候光刻机，在线等，真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来 ...

其实想玩龙芯可以试试gentoo，他对龙芯支持挺不错的

变老的大二 发表于 2025-1-25 16:26

泰坦失足发表于 2025-1-25 16:00
看了DeepSeek的paper，我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通，请问这些 ...

最俺寻思的是R1训练的时候深度思考出现了尤里卡时刻

hargen2000 发表于 2025-1-25 16:29

本帖最后由 hargen2000 于 2025-1-25 16:36 编辑

泰坦失足发表于 2025-1-25 16:00
看了DeepSeek的paper，我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通，请问这些 ...
你搞错了，小成本说的是V3，V3在架构上训练上优化了很多，而且是一次练成没有返工所以成本极低

R1是基于V3的RL，成本几乎可以忽略不计

550万美元这个成本是按照租GPU算力推算的，他们的高效体现在消耗的GPU小时数特别少

有鱼发表于 2025-1-25 16:33

现在X上都在传谣，说deepseek有50000片H100，这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大堆老黄的计算卡这件事情不能被动摇

大韩李明博 发表于 2025-1-25 16:36

hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻，短短一个月时间已经让美国人震撼了三次，六代机，小红书，deepse ...

陆续还会有，期待EUV光刻机震惊美帝那天。

大韩李明博 发表于 2025-1-25 16:36

有鱼发表于 2025-1-25 16:33
现在X上都在传谣，说deepseek有50000片H100，这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

牵头说的是scale ai那个唐脸高华。

变老的大二 发表于 2025-1-25 16:37

有鱼发表于 2025-1-25 16:33
现在X上都在传谣，说deepseek有50000片H100，这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

西方赢学是这样的。还有说是嘻嘻皮在背后大规模资助，用来动摇ClosedAi造奇观的决心的。

2017.05.04 发表于 2025-1-25 16:43

有鱼发表于 2025-1-25 16:33
现在X上都在传谣，说deepseek有50000片H100，这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

看见了，说肯定为了避免制裁藏了卡
我是没明白在这上面藏有什么意义
不知道算是否定还是怀疑，总之早晚得接受

qratosones1337 发表于 2025-1-25 16:45

挖泥船发表于 2025-1-25 13:17
零一和DeepSeek用的都是MoE（混合专家）模式，相当于是在事先准备的高质量数据集上去做特定训练，不能说在 ...

这明显是望文生义，错误理解了MoE是什么

—— 来自鹅球 v3.3.96

有鱼发表于 2025-1-25 16:46

2017.05.04 发表于 2025-1-25 16:43
看见了，说肯定为了避免制裁藏了卡
我是没明白在这上面藏有什么意义
不知道算是否定还是怀疑，总之早晚得 ...
万一被投资方问“你们为啥要这么多卡？”
还能用这些谣言糊弄过去吧
这群jai和白皮能不能说句谢谢西批西哇

页: 1 2 3 4 5 6 7 [8] 9 10 11 12 13

Stage1st's Archiver