找回密码
 立即注册
搜索
楼主: 机吉斯卡

[科技] 西方自找的没落(转型DEEPSEEK讨论楼

[复制链接]
     
发表于 2024-12-27 18:08 | 显示全部楼层
本帖最后由 qratosones1337 于 2024-12-27 18:11 编辑
橋白 发表于 2024-12-27 17:55
本来就放不下啊 moe结构说白了是省电费又不是省显存…

论坛助手,iPhone

利好超大显存的廉价推理卡,正好这次DeepSeek开源的时候也同步发布了昇腾可用的推理方案,估计DeepSeek自己可能已经在用Atlas300I Duo来推理了(这玩意有96G显存,一张卡不到3W块钱)。用N卡的话现在H20到手价也不贵
回复

使用道具 举报

     
发表于 2024-12-27 18:10 | 显示全部楼层
泰坦失足 发表于 2024-12-27 17:48
这玩意尺寸是671B,啥卡能放下啊. llama 3.2的405b都挺抽象的了.

华为有个Atlas300I,96G显存版本单卡售价3W块钱不到,正好这次模型Release的时候连MindIE推理镜像都一起发了
回复

使用道具 举报

     
发表于 2024-12-27 18:13 | 显示全部楼层
本帖最后由 yanjunle 于 2024-12-27 18:14 编辑

deepseek-v3发布最思细恐极的一点不是涨价预告吗,不知道为什么没看到什么相关的讨论。
幻方是今年这轮api价格战的发动者,5月份靠“模型结构创新+超强infra+不求盈利只求打平推理成本”实现了一块钱一百万token还能维持50%毛利,可以认为幻方拥有世界上最顶尖不用加之一的llm工程团队。
以及目前llm性能增长的方向是test-time scaling,qwq和deepseek-r1看起来都是走成倍增加输出token数来解决更困难的问题的路线,输出token数增加会导致使用成本急剧上涨(比如前几天o3发布时号称做一道题要用掉3500刀),只能寄希望于降低token输出单价来降低整体使用成本。
然而deepseek涨价了,说明即使世界最强工程团队也控制不住llm推理成本了,llm智价比很可能已经到顶了,未来都是1块钱2分货10块钱3分货了
回复

使用道具 举报

     
发表于 2024-12-27 18:14 | 显示全部楼层
qratosones1337 发表于 2024-12-27 18:07
说明泥潭喜欢不懂装懂的懂哥太多了,啥都想插一句嘴,然后自己又根本不懂(甚至可能都没到一知半解的地步 ...

乐,在跑实验罢了,哪个一线算法天天追论文不做业务
回复

使用道具 举报

     
发表于 2024-12-27 18:15 来自手机 | 显示全部楼层
上联:一艘两攻共三架飞机四款新品搞得五角大楼六神无主七上八下酒后加班十分难受

下联:十点九分看八方网友七彩贺图庆祝六代战机五湖纵横四海三山两府沸腾一等先进。

评分

参与人数 4战斗力 +4 收起 理由
belichick + 1 好评加鹅
Evecat + 1
a4ac7 + 1 快来人,出对子对死他!
火星後繼者 + 1 不愧是对穿肠!

查看全部评分

回复

使用道具 举报

     
发表于 2024-12-27 18:18 | 显示全部楼层
忽然想起,之前我看到最搞笑的是之前千问2.5出来的时候,我在推上搜,看到一个日本人对千问回答他说**是中国的无能狂怒,软不软文啥的,反正现在玩家就只有中美,本身就是一种证明
回复

使用道具 举报

     
发表于 2024-12-27 18:24 | 显示全部楼层
从语文的角度来看,这篇文章是否是软文暂且不论,但前后逻辑混乱矛盾,的确需要打回去重写。文章以西大制造业衰退,没人研发硬件为开篇,批判“软件吞噬世界”,然后拉上宇树蹭热度,还以为要为我国博兴的制造产业呐喊,结果最后话锋一转落脚到给一个量化基金开发的AI模型张目,别忽悠大众行吗,你这个量化基金的AI项目不是你上面批判的软件么,还是个搞金融出身的软件服务,怎么三五行文字之后你都不知道自己前面说的那么多废话了?
回复

使用道具 举报

     
发表于 2024-12-27 18:30 | 显示全部楼层
别的不懂,幻方跳到llm也能吹是眼力吗 之前还全网群嘲来着
回复

使用道具 举报

     
发表于 2024-12-27 18:34 | 显示全部楼层
出逃白鲸 发表于 2024-12-27 16:29
楼主没贴作者名字,个人凭感觉这个作者肯定不是制造业的,说了半天很空洞。
观点也许对,但内容空,套话多 ...

作者是著名微博/X国师@阑夕
回复

使用道具 举报

     
发表于 2024-12-27 19:09 来自手机 | 显示全部楼层
Van夫膜开 发表于 2024-12-27 16:28
从搞量化私募直接转行搞LLM,这个决心和眼界是真的牛逼

啥决心啊,20/21年幻方牛市里基金效益好,老总信心来了就梭哈了10000张A100搞深度学习挖因子,结果整的过拟合效益回撤了50%。当时都在嘲讽他们步子太大扯着蛋。
结果老登算力禁运后这10000张卡瞬间成了香饽饽,就顺势转到AI了
回复

使用道具 举报

     
发表于 2024-12-27 19:13 来自手机 | 显示全部楼层
泰坦失足 发表于 2024-12-27 17:48
这玩意尺寸是671B,啥卡能放下啊. llama 3.2的405b都挺抽象的了.

幻方因为机缘巧合有10000张A100,所以AI发展还是要靠算力
回复

使用道具 举报

     
发表于 2024-12-27 19:16 来自手机 | 显示全部楼层
yuialon 发表于 2024-12-27 17:03
纯软广,预训练技术路线已经到头了
下一代路线如果摸索出来,预训练直接被扫进垃圾桶


没有证监会也会转
金融数据这种信噪比极低的数据搞深度学习只能搞出一堆过拟合。上了A100后幻方的业绩直接过山车。再加上美国禁运,国内在也搞不到这么多卡,转AI就是个顺势而为的事了
回复

使用道具 举报

     
发表于 2024-12-27 19:20 | 显示全部楼层
就算软文怎么了,黑猴做的那么牛逼也需要宣传啊

—— 来自 S1Fun
回复

使用道具 举报

发表于 2024-12-27 19:22 来自手机 | 显示全部楼层
yanjunle 发表于 2024-12-27 18:13
deepseek-v3发布最思细恐极的一点不是涨价预告吗,不知道为什么没看到什么相关的讨论。
幻方是今年这轮api ...

硬件不是发展停滞的。未来有更便宜更强的推理硬件完全是可能的。

—— 来自 Xiaomi 23049RAD8C, Android 14上的 S1Next-鹅版 v2.5.2-play
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-12-27 19:34 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-12-27 19:37 来自手机 | 显示全部楼层
yanjunle 发表于 2024-12-27 18:13
deepseek-v3发布最思细恐极的一点不是涨价预告吗,不知道为什么没看到什么相关的讨论。
幻方是今年这轮api ...

从GPT的百分之一涨到了50分之一,如涨

—— 来自 鹅球 v3.3.92
回复

使用道具 举报

发表于 2024-12-27 19:39 | 显示全部楼层
longrider 发表于 2024-12-27 18:34
作者是著名微博/X国师@阑夕

一下子就合理了,这种瞎**扯淡不懂装懂的味道
回复

使用道具 举报

     
发表于 2024-12-27 19:39 来自手机 | 显示全部楼层
overflowal 发表于 2024-12-27 19:22
硬件不是发展停滞的。未来有更便宜更强的推理硬件完全是可能的。

—— 来自 Xiaomi 23049RAD8C, Android ...

我猜现在可能已经在用昇腾了,毕竟MoE对于大显存廉价推理卡是重大利好,然后这次昇腾推理镜像也跟着一起首发就有了。三万块钱一张的Atlas300I跑7B模型效费比打不过4090,但是跑这玩意那可就优势太大了。

—— 来自 鹅球 v3.3.92
回复

使用道具 举报

     
发表于 2024-12-27 19:57 | 显示全部楼层
deepseek算第一梯队的,而且速度也挺快的,总体来说我还是很喜欢用。不过如果能用claude还是claude,断档领先。
回复

使用道具 举报

     
发表于 2024-12-27 20:18 | 显示全部楼层
overflowal 发表于 2024-12-27 19:22
硬件不是发展停滞的。未来有更便宜更强的推理硬件完全是可能的。

—— 来自 Xiaomi 23049RAD8C, Android ...

也是,希望未来哪家下场发动一轮硬件价格战吧,起码限制下api涨价的趋势
回复

使用道具 举报

     
发表于 2024-12-27 20:25 | 显示全部楼层
这就纯属胡说了,波士顿动力被谷歌卖了并不是美国看不起制造业,而是波士顿动力不听话,波士顿动力这家公司很奇葩,虽然被收购了,也要保持独立运营,任何母公司来的人都被他们赶出去。谷歌派来的人被他们锁在一间独立的办公室,而且波士顿动力天天嘲笑谷歌人是傻子。。。这种企业谁受得了。。。
回复

使用道具 举报

     
发表于 2024-12-27 20:30 | 显示全部楼层
a4ac7 发表于 2024-12-27 16:51
在文字处理方面,感觉o1是有挺大提升的

拿坛友这个对子问

看了下那个帖子不是无了吗
回复

使用道具 举报

     
发表于 2024-12-27 20:44 来自手机 | 显示全部楼层
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以把需要庞大人工的制造业转移了出来降低成本,但不至于把本地工人都裁了就不管安置任自生自灭吧。
社会规训?单独说美国得了,美国社达很严重,认为私有化天经地义,人们默许这个规矩所以任由资本经营理念发展罔顾打工人利益?就像我去点130美元的饭,收了我20美元的小费,任由底层互害?
制度?全球化的概念其实是对全世界的剥削,包括美国自己,只是一群资本家为积攒更多财富的谎言,结果在这个过程中玩脱了,从阿富汗开始腐败不断,**上来彻底不装了要搞保护主义内部资本家也跟着内讧了,没人想着再做饼做大饼只想着把现在还剩的饼全吃了?国会打架谁也不服谁,全是代理人谁也不肯让步光顾着做一千多页的法案在犄角旮旯塞私货?

我觉得很匪夷所思啊,我知道这是个很复杂的问题,但我想像得了病的老人在家里留下几十年的垃圾变成纳垢培养窟也不愿打理。为啥?


—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.2
回复

使用道具 举报

     
发表于 2024-12-27 20:48 | 显示全部楼层
抛开别的不谈,chatgpt都什么老古董了,openAI都成什么样了
回复

使用道具 举报

     
发表于 2024-12-27 20:51 | 显示全部楼层
历史太短 没形成民族。
回复

使用道具 举报

     
发表于 2024-12-27 20:59 | 显示全部楼层
说宇树部分是软文都比说deepseek是软文更有道理,看起来deepseek这个工作还是很有影响力的,所有东西都开源了,还附上了很详细的技术报告
回复

使用道具 举报

     
发表于 2024-12-27 21:03 来自手机 | 显示全部楼层
火烧云 发表于 2024-12-27 20:30
看了下那个帖子不是无了吗

app的历史记录里有缓存,能看到

—— 来自 鹅球 v3.2.91
回复

使用道具 举报

     
发表于 2024-12-27 21:16 | 显示全部楼层
qratosones1337 发表于 2024-12-27 19:37
从GPT的百分之一涨到了50分之一,如涨

—— 来自 鹅球 v3.3.92

gpt4o升级到o1也涨价了啊,claude的haiku更新也在涨。
其他厂涨价可能是他们工程水平不行,毕竟v2时代幻方不光不涨价,每个月还能发一个提升一点跑分的新版本。现在幻方也涨了,说明智价比极限就到这了,今后智能提升都要加钱了。
回复

使用道具 举报

     
发表于 2024-12-27 21:54 | 显示全部楼层
迷路的石头 发表于 2024-12-27 19:09
啥决心啊,20/21年幻方牛市里基金效益好,老总信心来了就梭哈了10000张A100搞深度学习挖因子,结果整的过 ...

也不能这么看吧,至少能招到人,还能从一堆学术骗子和学阀里招到真正的牛人,这也算是很牛了。至少人家没有趁机把卡全部转手套现跑路吧
回复

使用道具 举报

     
发表于 2024-12-27 22:36 | 显示全部楼层
“第42号宇宙可增殖自主开发BOT进展如何?”——“自从双螺旋底层代码写入BIOS已经很久了,现在才刚刚稳定增殖能够迭代虚拟自主研发系统的架设机器人。”——“太慢了!这全宇宙的统筹信息报告及开发指南我什么时候才能拿到?”——“马上就快了,现在的架设机器人才刚刚迭代它们相互之间的信息交互带宽,只要带宽和算力管够,虚拟自主研发系统分分钟就能狂暴增殖。”
回复

使用道具 举报

     
发表于 2024-12-27 22:46 | 显示全部楼层
“草,崩溃了”——“怎么了?”——“这帮架设机器人开始窥探整个虚拟宇宙的底层逻辑了,你知道的,我们这个虚拟宇宙是运行在一个服务器上的,而它们窥探的时候会造成局部细节爆炸,超过了服务器的载荷,产生了各种BUG,更操蛋的是,这帮架设机器人归纳了这些可以复现的BUG,称之为《量子力学》!”——“……没救了,把42号宇宙的进程杀掉,服务器强制重启吧。”
回复

使用道具 举报

     
发表于 2024-12-27 22:49 | 显示全部楼层
DeepSeek和Qwen这两个已经是世界第一的开源模型了。现在是洋人感谢中国马圣开源。
回复

使用道具 举报

发表于 2024-12-27 23:29 来自手机 | 显示全部楼层
clmd 发表于 2024-12-27 20:25
这就纯属胡说了,波士顿动力被谷歌卖了并不是美国看不起制造业,而是波士顿动力不听话,波士顿动力这家公司 ...

主要还是不赚钱,谷歌能赚钱把资本赶出董事会也没啥问题,不能赚钱就是原罪。
回复

使用道具 举报

发表于 2024-12-27 23:32 来自手机 | 显示全部楼层
LilithMardin 发表于 2024-12-27 20:44
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以 ...

就是苏联没了,资本不用再去讨好平民了所以就开始搞美其名曰全球化本质就是抛弃国内的无产阶级的产业转移。所以可以想见的未来资本选择AI抛弃血肉人的趋势是必然的,到那时恐怕更多的人才会认识到资本的反人类属性。
回复

使用道具 举报

     
发表于 2024-12-28 00:16 来自手机 | 显示全部楼层
LilithMardin 发表于 2024-12-27 20:44
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以 ...

这些问题答案都写在谜面上了啊😦,只能说人类创造的资本就是这样的盲目痴愚无人性的增值怪兽

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v3.0.0.81-alpha
回复

使用道具 举报

     
发表于 2024-12-28 00:30 | 显示全部楼层
这个Deepseek,说是开源,有没有民用显卡能跑的版本?有没有做很多限制在里面?
回复

使用道具 举报

     
发表于 2024-12-28 00:52 | 显示全部楼层
LilithMardin 发表于 2024-12-27 20:44
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以 ...

阿米就是上下层分离了,上层从全世界攫取资源和财富后发现下层啥情况已经基本不影响他们了,他们只要控制着全球经济的主导权,那么下层怎么样都无所谓,所以可以完全不顾下层死活,或者说只是涂脂抹粉装作关心下层

脑子变癌细胞了,身子再怎么挣扎也没用
回复

使用道具 举报

     
发表于 2024-12-28 00:59 | 显示全部楼层
商法医,商法医,
大家都读商法医
谁干实业谁傻批
回复

使用道具 举报

发表于 2024-12-28 01:30 来自手机 | 显示全部楼层
国内的制造业过得也不算好啊,希望未来不要不美国后尘

—— 来自 鹅球 v3.0.0.82-alpha
回复

使用道具 举报

     
发表于 2024-12-28 01:50 来自手机 | 显示全部楼层
o1 pro的对对子

这是一个“数词嵌入”的趣味联,因为原句把“一、二、三、四、五、六、七、八、九(谐音‘酒’)、十” 巧妙地串在一起,还结合了“酒后加班”“十分难受”等情节。对这样一个上联(如果把它看作上联),最关键的是也要在下联里依序安插相同的数字(或用谐音)来呼应,并尽量保持字数相等、节奏相近、语义也能自成一体。

下面给出一个示例对句,可视作“下联”。同样包含了“一、两、三、四、五、六、七、八、九(酒)、十”九个数字(其中“酒”谐音“九”),并凑足了与原句同样的 35 个字。

示例对句:

        一山两虎惊三江水涨四面狂掀搅得五岳失色六根不净七嘴八舌酒局收场十分荒诞

逐段拆解与对应
        •        一山两虎
“一”“两”呼应原句中的“一艘”“两攻”
        •        惊三江水涨
“三”呼应原句中“三架飞机”
        •        四面狂掀
“四”呼应“四款新品”
        •        搅得五岳失色
“五”对应“五角大楼”
        •        六根不净
“六”对应“六神无主”
        •        七嘴八舌
“七、八”对应“七上八下”
        •        酒局收场
“酒”谐音“九”,对应“酒后(九后)”
        •        十分荒诞
“十”对应“十分难受”

这样就完成了数字和位置上的一一呼应,同时也形成了一个完整、稍带戏谑的情境。你也可以根据自己的喜好,再去润色或改动其中的用词,让上下联在语义上更贴合某个主题。

        上联(原文)
一艘两攻共三架飞机四款新品
搞得五角大楼六神无主七上八下
酒后加班十分难受

        下联(示例)
一山两虎惊三江水涨四面狂掀
搅得五岳失色六根不净七嘴八舌
酒局收场十分荒诞
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 07:12 , Processed in 0.204719 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表