qratosones1337
发表于 2024-12-27 18:07
overflowal 发表于 2024-12-27 17:42
国内公司发了一个堪比商业闭源模型的开源模型,技术报告写的清清楚楚,国外ai圈子讨论的热火朝天。
国内 ...
说明泥潭喜欢不懂装懂的懂哥太多了,啥都想插一句嘴,然后自己又根本不懂(甚至可能都没到一知半解的地步),自然就只能甩锅软文咯。毕竟只要“雷达响了”就自动立于不败之地了
qratosones1337
发表于 2024-12-27 18:08
本帖最后由 qratosones1337 于 2024-12-27 18:11 编辑
橋白 发表于 2024-12-27 17:55
本来就放不下啊 moe结构说白了是省电费又不是省显存…
论坛助手,iPhone
利好超大显存的廉价推理卡,正好这次DeepSeek开源的时候也同步发布了昇腾可用的推理方案,估计DeepSeek自己可能已经在用Atlas300I Duo来推理了(这玩意有96G显存,一张卡不到3W块钱)。用N卡的话现在H20到手价也不贵
qratosones1337
发表于 2024-12-27 18:10
泰坦失足 发表于 2024-12-27 17:48
这玩意尺寸是671B,啥卡能放下啊. llama 3.2的405b都挺抽象的了.
华为有个Atlas300I,96G显存版本单卡售价3W块钱不到,正好这次模型Release的时候连MindIE推理镜像都一起发了
yanjunle
发表于 2024-12-27 18:13
本帖最后由 yanjunle 于 2024-12-27 18:14 编辑
deepseek-v3发布最思细恐极的一点不是涨价预告吗,不知道为什么没看到什么相关的讨论。
幻方是今年这轮api价格战的发动者,5月份靠“模型结构创新+超强infra+不求盈利只求打平推理成本”实现了一块钱一百万token还能维持50%毛利,可以认为幻方拥有世界上最顶尖不用加之一的llm工程团队。
以及目前llm性能增长的方向是test-time scaling,qwq和deepseek-r1看起来都是走成倍增加输出token数来解决更困难的问题的路线,输出token数增加会导致使用成本急剧上涨(比如前几天o3发布时号称做一道题要用掉3500刀),只能寄希望于降低token输出单价来降低整体使用成本。
然而deepseek涨价了,说明即使世界最强工程团队也控制不住llm推理成本了,llm智价比很可能已经到顶了,未来都是1块钱2分货10块钱3分货了
笨拙的机器人
发表于 2024-12-27 18:14
qratosones1337 发表于 2024-12-27 18:07
说明泥潭喜欢不懂装懂的懂哥太多了,啥都想插一句嘴,然后自己又根本不懂(甚至可能都没到一知半解的地步 ...
乐,在跑实验罢了,哪个一线算法天天追论文不做业务
御姐控之耻
发表于 2024-12-27 18:15
上联:一艘两攻共三架飞机四款新品搞得五角大楼六神无主七上八下酒后加班十分难受
下联:十点九分看八方网友七彩贺图庆祝六代战机五湖纵横四海三山两府沸腾一等先进。
moekyo
发表于 2024-12-27 18:18
忽然想起,之前我看到最搞笑的是之前千问2.5出来的时候,我在推上搜,看到一个日本人对千问回答他说**是中国的无能狂怒,软不软文啥的,反正现在玩家就只有中美,本身就是一种证明
Pz079
发表于 2024-12-27 18:24
从语文的角度来看,这篇文章是否是软文暂且不论,但前后逻辑混乱矛盾,的确需要打回去重写。文章以西大制造业衰退,没人研发硬件为开篇,批判“软件吞噬世界”,然后拉上宇树蹭热度,还以为要为我国博兴的制造产业呐喊,结果最后话锋一转落脚到给一个量化基金开发的AI模型张目,别忽悠大众行吗,你这个量化基金的AI项目不是你上面批判的软件么,还是个搞金融出身的软件服务,怎么三五行文字之后你都不知道自己前面说的那么多废话了?
双刀少女
发表于 2024-12-27 18:30
别的不懂,幻方跳到llm也能吹是眼力吗 之前还全网群嘲来着
longrider
发表于 2024-12-27 18:34
出逃白鲸 发表于 2024-12-27 16:29
楼主没贴作者名字,个人凭感觉这个作者肯定不是制造业的,说了半天很空洞。
观点也许对,但内容空,套话多 ...
作者是著名微博/X国师@阑夕
迷路的石头
发表于 2024-12-27 19:09
Van夫膜开 发表于 2024-12-27 16:28
从搞量化私募直接转行搞LLM,这个决心和眼界是真的牛逼
啥决心啊,20/21年幻方牛市里基金效益好,老总信心来了就梭哈了10000张A100搞深度学习挖因子,结果整的过拟合效益回撤了50%。当时都在嘲讽他们步子太大扯着蛋。
结果老登算力禁运后这10000张卡瞬间成了香饽饽,就顺势转到AI了
迷路的石头
发表于 2024-12-27 19:13
泰坦失足 发表于 2024-12-27 17:48
这玩意尺寸是671B,啥卡能放下啊. llama 3.2的405b都挺抽象的了.
幻方因为机缘巧合有10000张A100,所以AI发展还是要靠算力
迷路的石头
发表于 2024-12-27 19:16
yuialon 发表于 2024-12-27 17:03
纯软广,预训练技术路线已经到头了
下一代路线如果摸索出来,预训练直接被扫进垃圾桶
没有证监会也会转
金融数据这种信噪比极低的数据搞深度学习只能搞出一堆过拟合。上了A100后幻方的业绩直接过山车。再加上美国禁运,国内在也搞不到这么多卡,转AI就是个顺势而为的事了
ymm1030
发表于 2024-12-27 19:20
就算软文怎么了,黑猴做的那么牛逼也需要宣传啊
—— 来自 S1Fun
overflowal
发表于 2024-12-27 19:22
yanjunle 发表于 2024-12-27 18:13
deepseek-v3发布最思细恐极的一点不是涨价预告吗,不知道为什么没看到什么相关的讨论。
幻方是今年这轮api ...
硬件不是发展停滞的。未来有更便宜更强的推理硬件完全是可能的。
—— 来自 Xiaomi 23049RAD8C, Android 14上的 S1Next-鹅版 v2.5.2-play
FeteFrumoase
发表于 2024-12-27 19:34
qratosones1337
发表于 2024-12-27 19:37
yanjunle 发表于 2024-12-27 18:13
deepseek-v3发布最思细恐极的一点不是涨价预告吗,不知道为什么没看到什么相关的讨论。
幻方是今年这轮api ...
从GPT的百分之一涨到了50分之一,如涨
—— 来自 鹅球 v3.3.92
emmerMK3
发表于 2024-12-27 19:39
qratosones1337
发表于 2024-12-27 19:39
overflowal 发表于 2024-12-27 19:22
硬件不是发展停滞的。未来有更便宜更强的推理硬件完全是可能的。
—— 来自 Xiaomi 23049RAD8C, Android ...
我猜现在可能已经在用昇腾了,毕竟MoE对于大显存廉价推理卡是重大利好,然后这次昇腾推理镜像也跟着一起首发就有了。三万块钱一张的Atlas300I跑7B模型效费比打不过4090,但是跑这玩意那可就优势太大了。
—— 来自 鹅球 v3.3.92
右代宫嘉音
发表于 2024-12-27 19:57
deepseek算第一梯队的,而且速度也挺快的,总体来说我还是很喜欢用。不过如果能用claude还是claude,断档领先。
yanjunle
发表于 2024-12-27 20:18
overflowal 发表于 2024-12-27 19:22
硬件不是发展停滞的。未来有更便宜更强的推理硬件完全是可能的。
—— 来自 Xiaomi 23049RAD8C, Android ...
也是,希望未来哪家下场发动一轮硬件价格战吧,起码限制下api涨价的趋势
clmd
发表于 2024-12-27 20:25
这就纯属胡说了,波士顿动力被谷歌卖了并不是美国看不起制造业,而是波士顿动力不听话,波士顿动力这家公司很奇葩,虽然被收购了,也要保持独立运营,任何母公司来的人都被他们赶出去。谷歌派来的人被他们锁在一间独立的办公室,而且波士顿动力天天嘲笑谷歌人是傻子。。。这种企业谁受得了。。。
火烧云
发表于 2024-12-27 20:30
a4ac7 发表于 2024-12-27 16:51
在文字处理方面,感觉o1是有挺大提升的
拿坛友这个对子问
看了下那个帖子不是无了吗
LilithMardin
发表于 2024-12-27 20:44
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以把需要庞大人工的制造业转移了出来降低成本,但不至于把本地工人都裁了就不管安置任自生自灭吧。
社会规训?单独说美国得了,美国社达很严重,认为私有化天经地义,人们默许这个规矩所以任由资本经营理念发展罔顾打工人利益?就像我去点130美元的饭,收了我20美元的小费,任由底层互害?
制度?全球化的概念其实是对全世界的剥削,包括美国自己,只是一群资本家为积攒更多财富的谎言,结果在这个过程中玩脱了,从阿富汗开始腐败不断,**上来彻底不装了要搞保护主义内部资本家也跟着内讧了,没人想着再做饼做大饼只想着把现在还剩的饼全吃了?国会打架谁也不服谁,全是代理人谁也不肯让步光顾着做一千多页的法案在犄角旮旯塞私货?
我觉得很匪夷所思啊,我知道这是个很复杂的问题,但我想像得了病的老人在家里留下几十年的垃圾变成纳垢培养窟也不愿打理。为啥?
—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.2
shoel
发表于 2024-12-27 20:48
抛开别的不谈,chatgpt都什么老古董了,openAI都成什么样了
星花
发表于 2024-12-27 20:51
历史太短 没形成民族。
mrkikokiko
发表于 2024-12-27 20:59
说宇树部分是软文都比说deepseek是软文更有道理,看起来deepseek这个工作还是很有影响力的,所有东西都开源了,还附上了很详细的技术报告
a4ac7
发表于 2024-12-27 21:03
火烧云 发表于 2024-12-27 20:30
看了下那个帖子不是无了吗
app的历史记录里有缓存,能看到
—— 来自 鹅球 v3.2.91
yanjunle
发表于 2024-12-27 21:16
qratosones1337 发表于 2024-12-27 19:37
从GPT的百分之一涨到了50分之一,如涨
—— 来自 鹅球 v3.3.92
gpt4o升级到o1也涨价了啊,claude的haiku更新也在涨。
其他厂涨价可能是他们工程水平不行,毕竟v2时代幻方不光不涨价,每个月还能发一个提升一点跑分的新版本。现在幻方也涨了,说明智价比极限就到这了,今后智能提升都要加钱了。
Van夫膜开
发表于 2024-12-27 21:54
迷路的石头 发表于 2024-12-27 19:09
啥决心啊,20/21年幻方牛市里基金效益好,老总信心来了就梭哈了10000张A100搞深度学习挖因子,结果整的过 ...
也不能这么看吧,至少能招到人,还能从一堆学术骗子和学阀里招到真正的牛人,这也算是很牛了。至少人家没有趁机把卡全部转手套现跑路吧
HYNDコン
发表于 2024-12-27 22:36
“第42号宇宙可增殖自主开发BOT进展如何?”——“自从双螺旋底层代码写入BIOS已经很久了,现在才刚刚稳定增殖能够迭代虚拟自主研发系统的架设机器人。”——“太慢了!这全宇宙的统筹信息报告及开发指南我什么时候才能拿到?”——“马上就快了,现在的架设机器人才刚刚迭代它们相互之间的信息交互带宽,只要带宽和算力管够,虚拟自主研发系统分分钟就能狂暴增殖。”
HYNDコン
发表于 2024-12-27 22:46
“草,崩溃了”——“怎么了?”——“这帮架设机器人开始窥探整个虚拟宇宙的底层逻辑了,你知道的,我们这个虚拟宇宙是运行在一个服务器上的,而它们窥探的时候会造成局部细节爆炸,超过了服务器的载荷,产生了各种BUG,更操蛋的是,这帮架设机器人归纳了这些可以复现的BUG,称之为《量子力学》!”——“……没救了,把42号宇宙的进程杀掉,服务器强制重启吧。”
大阪黑鸡
发表于 2024-12-27 22:49
希德尼娅
发表于 2024-12-27 23:29
clmd 发表于 2024-12-27 20:25
这就纯属胡说了,波士顿动力被谷歌卖了并不是美国看不起制造业,而是波士顿动力不听话,波士顿动力这家公司 ...
主要还是不赚钱,谷歌能赚钱把资本赶出董事会也没啥问题,不能赚钱就是原罪。
希德尼娅
发表于 2024-12-27 23:32
LilithMardin 发表于 2024-12-27 20:44
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以 ...
就是苏联没了,资本不用再去讨好平民了所以就开始搞美其名曰全球化本质就是抛弃国内的无产阶级的产业转移。所以可以想见的未来资本选择AI抛弃血肉人的趋势是必然的,到那时恐怕更多的人才会认识到资本的反人类属性。
ayeah
发表于 2024-12-28 00:16
LilithMardin 发表于 2024-12-27 20:44
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以 ...
这些问题答案都写在谜面上了啊😦,只能说人类创造的资本就是这样的盲目痴愚无人性的增值怪兽
—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v3.0.0.81-alpha
naclken.
发表于 2024-12-28 00:30
这个Deepseek,说是开源,有没有民用显卡能跑的版本?有没有做很多限制在里面?
ace0018
发表于 2024-12-28 00:52
LilithMardin 发表于 2024-12-27 20:44
所以西方对制造业的没落到底是什么造成的?国内明明有那么多人口需要饭碗,我知道他们生活成本高人工高所以 ...
阿米就是上下层分离了,上层从全世界攫取资源和财富后发现下层啥情况已经基本不影响他们了,他们只要控制着全球经济的主导权,那么下层怎么样都无所谓,所以可以完全不顾下层死活,或者说只是涂脂抹粉装作关心下层
脑子变癌细胞了,身子再怎么挣扎也没用
爱撕衣魔刃
发表于 2024-12-28 00:59
商法医,商法医,
大家都读商法医
谁干实业谁傻批
哈尔路尼亚
发表于 2024-12-28 01:30
国内的制造业过得也不算好啊,希望未来不要不美国后尘
—— 来自 鹅球 v3.0.0.82-alpha
页:
1
[2]
3
4
5
6
7
8
9
10
11