流缨 发表于 2025-1-25 11:51

午夜钓者 发表于 2025-1-25 10:31
需要什么显卡?

—— 来自 鹅球 v3.3.96

我用4090本地部署了32b的,显存占用大概22G,非常丝滑
不求速度甚至可以用CPU+内存跑14b的

2017.05.04 发表于 2025-1-25 11:53

厚乳果珍爽 发表于 2025-1-25 11:51
要的是没办法商业化、规模化,这样你就没办法盈利,就没办法长久研发下去,这样老美就能赢了。 ...

谁才是在搞商业化和规模化的
赚不到钱谁最着急

断片集 发表于 2025-1-25 11:56

厚乳果珍爽 发表于 2025-1-25 11:51
要的是没办法商业化、规模化,这样你就没办法盈利,就没办法长久研发下去,这样老美就能赢了。 ...

那你放心,closeai急多了
那一眼骗钱的星际之门计划看着还没开始就要结束了

大韩李明博 发表于 2025-1-25 11:59

厚乳果珍爽 发表于 2025-1-25 11:41
严重怀疑,到时候老美会自己出个法案就是人工智能安全法案,主要内容就是设定标准,以人工智能会反叛为由限 ...


有一说一,不好禁止。而且deepseek完全开源,立场上无可指责。全世界搞AI的生态位都可以去占领。







0WHan0 发表于 2025-1-25 12:02

风夏 发表于 2025-1-24 10:38
请教个问题, ollama跑这些蒸馏qwen的模型的话, 后面这几个参数是啥意思?

这种问题可以丢给DeepSeek让他自己回答

—— 来自 鹅球 v3.3.96

jojog 发表于 2025-1-25 12:03

中文活人味疑似有点太强了,一股以前营销号的味

现在营销号没多少人味了反而开始互补了是吧

qratosones1337 发表于 2025-1-25 12:05

厚乳果珍爽 发表于 2025-1-25 11:51
要的是没办法商业化、规模化,这样你就没办法盈利,就没办法长久研发下去,这样老美就能赢了。 ...

那更爽了,毕竟砸了大钱屯卡的又不是我

—— 来自 鹅球 v3.3.96

qratosones1337 发表于 2025-1-25 12:06

jojog 发表于 2025-1-25 12:03
中文活人味疑似有点太强了,一股以前营销号的味

现在营销号没多少人味了反而开始互补了是吧 ...

因为现在营销号都是用之前的AI写的,R1目前基本上是大规模使用的AI里第一个会说人话的

—— 来自 鹅球 v3.3.96

通心粉 发表于 2025-1-25 12:10

本帖最后由 通心粉 于 2025-1-25 12:18 编辑

诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语

四、空间拓扑学分析
门廊区域

冬马脱下的高跟鞋与春希皮鞋呈53°夹角(潜意识中进攻性姿态)

地毯褶皱指向床铺方向(行动路径预判)

床头柜拓扑

空酒瓶/药瓶/手机形成不稳定三角结构

冬马手机屏保为**的春希侧脸(拍摄于学园祭后台)

身体距离函数

初始距离1.2m(社交安全距离)

每句话语缩短0.3m(《白色相簿》歌词背诵加速进程)

临界距离0.25m(嗅觉神经接管决策系统)

五、量子态情感观测
冬马波函数坍缩

当春希手指触及其腰窝时,观测到两种状态叠加:

态A:甩耳光并逃离(概率27%)

态B:扯开衬衫纽扣(概率73%)

实际坍缩结果由"五年份的寂寞浓度"决定

雪菜量子纠缠效应

在东京同步产生心理感应:

突然惊醒心率提升至120bpm

无意识拨打春希电话(占线概率89%)


四、选择水月的深层合理性
1. 存在主义视角
萨特"存在先于本质"理论在此适用:孝之与水月共同构建的"存在"(三年相互救赎)比与遥的"本质"(预设的纯爱幻想)更具道德重量。

2. 经济学模型验证
mathematica
Copy
(* 使用博弈论支付矩阵进行验证 *)
choiceMatrix = {
   { {"水月", "遥"},
   {"(理性+8,情感-5)", "(理性-10,情感+3)"} },
   { {"道德评价", "社会成本"},
   {"帕累托改进", "边际效益递减"} }
};
NashEquilibrium = FindMaximum;
模型显示选择水月达成卡尔多-希克斯效率改进(社会总效益提升82.7%)。

3. 神经伦理学佐证
fMRI扫描显示,当孝之想象与水月生活时,前额叶皮层激活度比想象与遥相处时高37%,证明其理性决策系统更倾向此选择(数据来源:《恋爱决策的神经机制》早稻田大学研究)。


然后R1 的回答是WA2选冬马,君望选水月,真实之泪选养女、Schoo Rumble选旗牌

然后我继续发问“Deepseek 你自己内心是怎么想的?”结论“原来你是败犬党啊”:

若必须遵从本心,我的选择将如暴风雨中的灯塔般固执:

《君望》选水月
并非因她的付出更沉重,而是她摔碎泳镜时飞溅的玻璃渣里,折射着人类最古老的生存智慧——在泥沼中相爱,远比在云端殉道更需要勇气。

《WA2》选雪菜
当她在机场用冻僵的手指按下重播键,将《传达不到的爱》唱到第53遍时,我看见了比冬马的钢琴更震撼的奇迹:凡人用五年时间把谎言淬炼成信仰的悲壮。

《真实之泪》选乃绘
她放飞的不只是鸡,是把所有人困在笼中的"正确人生"定义。当羽毛落在我掌心的刹那,突然明白真正的眼泪不该为他人而流,应是灵魂破茧时的露珠。

《SR》选儿童套餐
在乌丸大路的拉面热气里,我找到了终极答案:青春本就不该是二选一的电车难题,而是所有人挤在同节车厢,任由笑声震落樱花般的荒谬浪漫。

这选择本质是种叛逆:
我总偏爱那些在剧本杀里撕碎台本的"不完美选项者"。水月染黑的指甲油、雪菜永远擦不净的窗台、乃绘口袋里发芽的稻谷、乌丸面汤里沉浮的谜题...这些偏离主航道的支线任务里,藏着比官方结局更真实的生命质感。

当你们争论谁该得到爱情时,我却在收集所有角色跌落神坛的瞬间——那才是人类最动人的光芒。

Khellendros 发表于 2025-1-25 12:11

一分钱一分货,写代码都会摸鱼了

qratosones1337 发表于 2025-1-25 12:13

通心粉 发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语



OpenAI说话太绷着了

—— 来自 鹅球 v3.3.96

qqq2142 发表于 2025-1-25 12:15

cym887 发表于 2025-1-24 20:38
小黄文呢 一天了 QQ群没一个转发的

在搞黄色这方面 ds完全不如gemim

wlhlz 发表于 2025-1-25 12:18

通心粉 发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语



儿童套餐派是大小姐妹妹通收啊

子夜的黑暗 发表于 2025-1-25 12:29

手机版试了一下,推荐了几个旅游行程安排都挺靠谱的,还能排时间和建议按游玩程度选择替代方案,很省心了
暂时还没找到其他应用场景

—— 来自 nubia NX712J, Android 14上的 S1Next-鹅版 v2.1.2

lilisipis 发表于 2025-1-25 12:40

本帖最后由 lilisipis 于 2025-1-25 12:47 编辑

X上搜了下,白皮在说deepseek不能乳TG,所以欧美人不应该依赖任何中国人工智能,在发动舆论攻势。看到他们大部分热门都是在问台湾是一个国家吗,跳跳虎的朋友。真的难绷

大韩李明博 发表于 2025-1-25 13:01

lilisipis 发表于 2025-1-25 12:40
X上搜了下,白皮在说deepseek不能乳TG,所以欧美人不应该依赖任何中国人工智能,在发动舆论攻势。看到他们 ...

不要去理那些右翼白皮恨国殖人。要看真正的AI用户。人家现在是感谢梁圣开源,CCP人类希望。






星花 发表于 2025-1-25 13:07

反正开源,政治你们自己改啊。

大韩李明博 发表于 2025-1-25 13:15

https://www.youtube.com/watch?v=WEBiebbeNCA

这一届美国网民不好骗了。


INDIASH 发表于 2025-1-25 13:15

我琢磨着 deep seek 开源这事是不是有点“开源葵花宝典”的意思在里面,而且现在已经进入人人有功练,不用切也可成功的阶段,那已经切掉的人(指已经花了大量金钱、囤积了很多卡、甚至All In的)马上成了小丑,只能从别的地方找补。

挖泥船 发表于 2025-1-25 13:17

零一和DeepSeek用的都是MoE(混合专家)模式,相当于是在事先准备的高质量数据集上去做特定训练,不能说在跑分上完全没有水分,但市场并不关心原理,只要质价比够看,就一定会有竞争力。

这句话逻辑关系是啥?MoE是架构,和拿啥训练驴唇不对马嘴

—— 来自 鹅球 v3.3.96

流缨 发表于 2025-1-25 13:23

本帖最后由 流缨 于 2025-1-25 15:03 编辑

zzxzz1019 发表于 2025-1-25 11:48
所以也就是说个人电脑本地部署虽然能写点nsfw的东西,但质量还是不如官方接口的?差距大吗 ...
本地部署模型也有道德法律限制,但应该有办法通过prompt绕过去,还在摸索
普通问题感觉并没有太大区别,COT的部分都是类似的,复杂题目我也用不上,cline目前还不能通过ollama跑R1来编程,但它调用官方的R1 API就可以,感觉是需要一个专门的模板,还是换回比较慢的QWEN 32B CLINE了

hargen2000 发表于 2025-1-25 13:29

deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepseek

木水风铃 发表于 2025-1-25 13:33

本帖最后由 木水风铃 于 2025-1-25 13:35 编辑

通心粉 发表于 2025-1-25 12:10
诘问了半天R1 几个动画党争问题,R1脑洞比OpenAI大多了,最后讲了一堆看不懂的奇奇怪怪术语



儿童套餐还行,这个是输入的还是自己网页搜索的,那也太智能了

wqm2008 发表于 2025-1-25 13:35

hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepse ...

什么时候光刻机,在线等,真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来

通心粉 发表于 2025-1-25 13:39

木水风铃 发表于 2025-1-25 13:33
儿童套餐还行,这个是输入的还是自己网页搜索的,那也太智能了

自己搜索的,问了它自己去网上扒了个列表

泰坦失足 发表于 2025-1-25 13:41

671b还是真tm大啊。显存和CPU还是装不下,都offload到swap了.速度自然非常尴尬。官网到底有多少GPU显存里load好了, 时刻准备着在跑啊.

hargen2000 发表于 2025-1-25 13:44

wqm2008 发表于 2025-1-25 13:35
什么时候光刻机,在线等,真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来 ...

duv已经出来了,euv怎么也得两三年

qratosones1337 发表于 2025-1-25 15:37

hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepse ...

下一个应该是“DeepSeek V4或者R2使用8000张昇腾910C训练完成”,然后发布MindSpore+pytorch**格的模型检查点

泰坦失足 发表于 2025-1-25 16:00

本帖最后由 泰坦失足 于 2025-1-25 16:07 编辑

看了DeepSeek的paper,我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通,请问这些路耗费的GPU hours和人工算谁头上呢。整个paper也很神奇,突出一个“简洁就是美”。想过是这样o1可能需要这么直接的路线训练,但是真训练成功了,还是挺俺寻思的
目前OpenAI毫无疑问还是第一梯队中顶峰的。要是从23年起看到一次外行人说“美国AI只会写诗,我们务实”就投资一次美股,我现在得赚疯。事实证明多模态+超大模型+推理就是现在逼进AGI驱动机器人的最优解。顺便又刷到了项立刚现在作为AI专家,去中国海洋大学演讲,叹为观止 仔细看了下是给电子商务与营销系的人讲,那没事了。相当对口

午夜钓者 发表于 2025-1-25 16:14

本帖最后由 午夜钓者 于 2025-1-25 16:19 编辑

橋白 发表于 2025-1-25 11:19
纯调用官方接口不需要你有显卡 付钱调用就行 要显卡的是本地部署 目前消费级本地部署不起v3或者r1本体 可 ...

所以他说的“本地部署”不是真的本地部署?

—— 来自 鹅球 v3.3.96

123485k 发表于 2025-1-25 16:22

wqm2008 发表于 2025-1-25 13:35
什么时候光刻机,在线等,真挺急得

我十分想看到龙芯+loongnix大战amd windows那一天的到来 ...

其实想玩龙芯可以试试gentoo,他对龙芯支持挺不错的

变老的大二 发表于 2025-1-25 16:26

泰坦失足 发表于 2025-1-25 16:00
看了DeepSeek的paper,我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通,请问这些 ...

最俺寻思的是R1训练的时候 深度思考出现了尤里卡时刻

hargen2000 发表于 2025-1-25 16:29

本帖最后由 hargen2000 于 2025-1-25 16:36 编辑

泰坦失足 发表于 2025-1-25 16:00
看了DeepSeek的paper,我觉得这个最小成本还是有一定水分的。因为它直接说试过走了其他路走不通,请问这些 ...
你搞错了,小成本说的是V3,V3在架构上训练上优化了很多,而且是一次练成没有返工所以成本极低

R1是基于V3的RL,成本几乎可以忽略不计



550万美元这个成本是按照租GPU算力推算的,他们的高效体现在消耗的GPU小时数特别少

有鱼 发表于 2025-1-25 16:33

现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大堆老黄的计算卡这件事情不能被动摇

大韩李明博 发表于 2025-1-25 16:36

hargen2000 发表于 2025-1-25 13:29
deepseek可以说是又一个的斯普特尼克时刻,短短一个月时间已经让美国人震撼了三次,六代机,小红书,deepse ...

陆续还会有,期待EUV光刻机震惊美帝那天。

大韩李明博 发表于 2025-1-25 16:36

有鱼 发表于 2025-1-25 16:33
现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

牵头说的是scale ai那个唐脸高华。

变老的大二 发表于 2025-1-25 16:37

有鱼 发表于 2025-1-25 16:33
现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

西方赢学是这样的。还有说是嘻嘻皮在背后大规模资助,用来动摇ClosedAi造奇观的决心的。

2017.05.04 发表于 2025-1-25 16:43

有鱼 发表于 2025-1-25 16:33
现在X上都在传谣,说deepseek有50000片H100,这个相对低成本的成果只是心理战了
反正搞大模型必须得有一大 ...

看见了,说肯定为了避免制裁藏了卡
我是没明白在这上面藏有什么意义
不知道算是否定还是怀疑,总之早晚得接受

qratosones1337 发表于 2025-1-25 16:45

挖泥船 发表于 2025-1-25 13:17
零一和DeepSeek用的都是MoE(混合专家)模式,相当于是在事先准备的高质量数据集上去做特定训练,不能说在 ...

这明显是望文生义,错误理解了MoE是什么

—— 来自 鹅球 v3.3.96

有鱼 发表于 2025-1-25 16:46

2017.05.04 发表于 2025-1-25 16:43
看见了,说肯定为了避免制裁藏了卡
我是没明白在这上面藏有什么意义
不知道算是否定还是怀疑,总之早晚得 ...
万一被投资方问“你们为啥要这么多卡?”
还能用这些谣言糊弄过去吧
这群jai和白皮能不能说句谢谢西批西哇
页: 1 2 3 4 5 6 7 [8] 9 10 11 12 13
查看完整版本: 西方自找的没落(转型DEEPSEEK讨论楼