Stage1st

 找回密码
 立即注册
搜索
楼主: 红色的鲨鱼
打印 上一主题 下一主题

[育儿] 外媒:芯片制裁起作用了!

[复制链接]
     
121#
发表于 2024-4-19 20:16 | 只看该作者
本帖最后由 best32167 于 2024-4-19 20:35 编辑
ycjiang1337 发表于 2024-4-19 20:11
楼上已经跟你说了,预计华为今年要出货40-60万计算卡,你贴个规划能证明什么呢?今天正好Meta发布了llama ...

那我知道你意思了,你是想说搞巨模型不如多搞中小尺寸模型吧
最后还是看GPT5表现,然后摸着鹰酱过河



回复

使用道具 举报

     
122#
发表于 2024-4-19 20:47 来自手机 | 只看该作者
best32167 发表于 2024-4-19 20:16
那我知道你意思了,你是想说搞巨模型不如多搞中小尺寸模型吧
最后还是看GPT5表现,然后摸着鹰酱过河

巨模型指的是预估1000B总规模的模型,比如推测中的GPT-4可能就是1000B的MoE模型。目前看来GPT-4迭代已经进入明显的瓶颈期了,前段时间更新的GPT-4-0409,问它23年下半年的知识(理论上应该知道)一样胡说八道,等于是基础的知识掌握和幻觉控制能力出现了严重退步。

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
123#
发表于 2024-4-19 20:56 来自手机 | 只看该作者
best32167 发表于 2024-4-19 10:09
大家很乐观啊,对于软件相关的就麻烦了
芯片制裁当然有用,看不到超越美帝的可能性了,只想倒腾出来的大模 ...

有没有可能gpt4这种大模型就不是未来的主流,因为效能太低了,多个小模型并联才是更高效的做法。当然技术发展很快,未来谁说的准呢,有美帝趟路不要太开心

—— 来自 HUAWEI TAH-AN00m, Android 12上的 S1Next-鹅版 v2.2.2.1
回复

使用道具 举报

     
124#
发表于 2024-4-19 20:59 | 只看该作者
以为是大模型笔误成巨模型

哎还是去搞点华为卡吧,免得日后失业
年初涨价后预算直接砍掉了
回复

使用道具 举报

     
125#
发表于 2024-4-19 21:41 来自手机 | 只看该作者
本帖最后由 ycjiang1337 于 2024-4-19 21:46 编辑
best32167 发表于 2024-4-19 20:59
以为是大模型笔误成巨模型

哎还是去搞点华为卡吧,免得日后失业

目前具体多大参数还是猜测阶段,也没准GPT4也就200B,但从推理时间来看GPT4和claude3超大杯确实明显体量大很多。目前看来巨模型明显存在模型更新困难,稳定性差的问题,作为对比GLM4的API现在已经知道什么是gemma了,GPT4现在连什么是mistral7b都经常口胡。理论上新知识可以通过联网 RAG解决,但是RAG需要额外工程资源,而且加上上下文之后速度更慢成本更高,现在官网plus的GPT4就特别摆烂,你不强制指定联网的话完全不会自己搜索。

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
126#
发表于 2024-4-19 21:46 来自手机 | 只看该作者
best32167 发表于 2024-4-19 20:59
以为是大模型笔误成巨模型

哎还是去搞点华为卡吧,免得日后失业

另外感觉openai现在魔怔了…模型的基础能力是知识掌握,幻觉控制和指令遵循,除此之外的所谓高阶逻辑应该通过提高模型基础能力来提升。但目前看来openai似乎用了某些奇怪的技巧,可以强行提高逻辑能力,但牺牲基础能力,GPT4更新之后我自己就碰上过多次绷不住的情况,中文提问用英文回答,以前GPT4从来都不出这种错误。再一个,知识库截止日期是23年12月,理论上应该知道什么是百川2,结果提问之后只有第一次答对了,后面重新刷新提问之后每一次都是五花八门的错误…

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
127#
发表于 2024-4-19 21:53 | 只看该作者
陈乔恩 发表于 2024-4-19 20:56
有没有可能gpt4这种大模型就不是未来的主流,因为效能太低了,多个小模型并联才是更高效的做法。当然技术 ...

比如人的日常交流还是类似GPT的通用沟通领域,理解和交流,涉及专业知识再用专用AI模型进行工作,不冲突的
回复

使用道具 举报

     
128#
发表于 2024-4-19 21:56 | 只看该作者
ycjiang1337 发表于 2024-4-19 21:46
另外感觉openai现在魔怔了…模型的基础能力是知识掌握,幻觉控制和指令遵循,除此之外的所谓高阶逻辑应该 ...

正常,我用Gemini的时候如果让他分析代码,除非第二次指定用中文重复,它一定会用英文回答,但是你可以用英文提问,然后带上 “using Chinese” 就行了
回复

使用道具 举报

     
129#
发表于 2024-4-19 23:33 来自手机 | 只看该作者
从心, 发表于 2024-4-19 21:56
正常,我用Gemini的时候如果让他分析代码,除非第二次指定用中文重复,它一定会用英文回答,但是你可以用 ...

Gemini是个菜鸡,绷不住非常正常,但是GPT4以前从来都不会出现这种问题。

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

130#
发表于 2024-4-20 14:29 | 只看该作者
ycjiang1337 发表于 2024-4-19 15:27
有传言说920是910叠加之后的产物,类似于B200相对于H100,考虑到910现在一大短板是多卡互联,叠加确实可 ...

我怀疑下一代不会叫920,因为他们的通算CPU叫鲲鹏920,如果算力芯片叫昇腾920那么很容易混淆。
回复

使用道具 举报

     
131#
发表于 2024-4-20 16:06 | 只看该作者
7776169 发表于 2024-4-19 12:41
别的不说
ai作图这东西让我这种完全不会画画的人也能做点自己喜欢的角色的小色图

展开聊聊ai作瑟图 老哥
回复

使用道具 举报

     
132#
发表于 2024-4-20 16:41 | 只看该作者
foreversmiles 发表于 2024-4-18 12:17
雷蒙德  原名雷锋  伟大的无产阶级革命同志  深入敌后腹地 为新中国的发展鞠躬尽瘁 作为了伟大的贡献 ...

人人都爱雷蒙德
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|stage1st 沪ICP备13020230号-1 沪公网安备 31010702007642号

GMT+8, 2024-5-3 03:09 , Processed in 0.024428 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表