找回密码
 立即注册
搜索
楼主: lvseqiji

[科技] 科大讯飞刘庆峰:华为GPU已可对标英伟达A100

[复制链接]
     
发表于 2023-8-26 15:40 | 显示全部楼层
本帖最后由 Fradeet 于 2023-8-26 15:44 编辑

昇腾开发者套件用户,目前我就当 TensorRT 玩的。
不过主楼这个新闻一个实的型号和虚的型号比实属有点眼界大开。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2023-8-26 15:42 来自手机 | 显示全部楼层
燕山雪 发表于 2023-8-26 15:31
llama"泄露"后一堆中国自主大模型就突然神奇的出现了,个个都号称反超openai,讯飞是个特别典型的例子… ...

其实我觉得这事儿有个误区,那个模型泄露导致的套壳本质不应该视为坏事,实际在ai领域利用前人的训练结果进行强化本身就是一个方法

就和ai作图一样,对应大模型做出的lora效果要是抛开最初泄露的那个版本的checkpoint必然不会到现在这个地步

大模型泄露导致可以节省大量资本成本从而可以踩在巨人肩膀上进行更好的改进这件事就是完全没问题

或者说,要求科技发展必须从发明造轮子开始也太怪了

—— 来自 OnePlus IN2020, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-8-26 15:47 | 显示全部楼层
Sacross 发表于 2023-8-26 15:42
其实我觉得这事儿有个误区,那个模型泄露导致的套壳本质不应该视为坏事,实际在ai领域利用前人的训练结果 ...

当然不是坏事,但人vicuna什么的没有造假违反开源协议然后吹嘘自己100%自主知识产权啊
回复

使用道具 举报

     
发表于 2023-8-26 15:51 | 显示全部楼层
不热爱讨论 发表于 2023-8-26 13:22
讯飞对标ChatGPT,今年10月24日在中文领域将全面超越,英文领域会与其相当

标题的可信性和这句话的可信性 ...

内部的什么情况不知道,讯飞目前对公众开放的星火个人用起来感觉不如百度的文心一言…
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-26 15:58 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-8-26 15:59 来自手机 | 显示全部楼层
之前和cs的大佬开会也是说算力上华为已经不错了,但是软件生态不太行所以实际使用比A100差不少,讯飞应该是自己从头造了很多轮子吧
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-26 16:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2023-8-26 16:09 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-26 16:14 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-8-26 16:19 | 显示全部楼层
lvseqiji 发表于 2023-8-26 16:09
并不是llama泄漏,而是chatGPT火了之后,国内的公司才意识到可以这么玩。
你硬说国内直接用的llama接着训 ...

1 “直接用的llama接着训练”是你说的不是我说的,请勿脑补
2 这玩意的瓶颈不在算力在大规模高质量语料和训练trick等等,如果不熟悉这些玩意,还是安心看热闹比较好,讨论火箭用无烟煤还是水洗煤真没那么好玩。
回复

使用道具 举报

     
发表于 2023-8-26 16:25 | 显示全部楼层
先接受再理解 发表于 2023-8-26 16:14
几千亿参数的模型,海量标记过的数据,训练所需的大量AI卡,训练一次需要耗费的千万级电费,国内能搞定且 ...

这玩意的意义在基础研究而非应用,所以再怎么嘲讽百度,文心一言和chatGLM这种能在这个方向上一直坚持还是很可贵的,虽然商业价值现在还很难说。
回复

使用道具 举报

     
发表于 2023-8-26 16:34 | 显示全部楼层
 8月14日晚间,科大讯飞(002230)发布公告,公司董事长刘庆峰卖出自家公司3995.61万股股份;此次减持后,刘庆峰对科大讯飞持股数量从1.68亿股降至1.28亿股,持股比例则由7.27%缩减至5.54%。

形势一片大好,董事长你怎么要跑啊?
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-26 16:59 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2023-8-26 17:16 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
发表于 2023-8-26 17:16 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-26 17:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-26 17:38 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-8-26 17:42 | 显示全部楼层
AI领域根本没有生态,cuda在目前的ai领域就是一坨屎
回复

使用道具 举报

     
发表于 2023-8-26 21:57 | 显示全部楼层
光一个S1就这么多懂LLM的算法哥,我看国内AIGC这个形式不是小好,是大好
回复

使用道具 举报

     
发表于 2023-8-26 22:23 | 显示全部楼层
本帖最后由 燕山雪 于 2023-8-27 13:07 编辑

看到扣分还是有点惊讶的,所以S1还有利益相关方么……
编辑:似乎是踩到某粉丝群的尾巴了~
再编辑:莫名其妙把沸腾粉搞破防了,论坛成就+1~
回复

使用道具 举报

     
发表于 2023-8-26 22:57 | 显示全部楼层
mythgogo 发表于 2023-8-26 16:34
 8月14日晚间,科大讯飞(002230)发布公告,公司董事长刘庆峰卖出自家公司3995.61万股股份;此次减持后,刘 ...

好奇看了下,卖完第二天十字星还好,第三天暴跌!然后一路跌还没回来。这是有消息跑路还是跑路了吓尿股民?
回复

使用道具 举报

     
发表于 2023-8-26 23:17 来自手机 | 显示全部楼层
人工智能就是看中美竞争了,目前看我国是要后发制人了
回复

使用道具 举报

发表于 2023-8-26 23:23 | 显示全部楼层
什么时候来个xavier平替
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-26 23:33 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-8-26 23:45 | 显示全部楼层
国内大模型从来不是突然出现,只是之前这行没什么人关注,可以说AI整个世界只有中美有比较完整的上下游产学研产业链
回复

使用道具 举报

     
发表于 2023-8-26 23:46 | 显示全部楼层
云卷花开r 发表于 2023-8-26 15:16
不太行,这玩意瞄准的硬件形态太窄了,搞这一套它就是想告诉大家以后设计硬件按这个形式来,这点不现实

...

谷歌的TPU都可以不依赖老黄的CUDA,菊花再搭一套这个也不是很难
回复

使用道具 举报

     
发表于 2023-8-26 23:47 来自手机 | 显示全部楼层
总感觉这个裤衩是不是太红了
回复

使用道具 举报

     
发表于 2023-8-26 23:54 | 显示全部楼层
LHO 发表于 2023-8-26 23:33
llama什么的我是不太懂, 不过你说的这个华为制程被锁好像跟华为搞的企业人工智能无关, 不是手机那一滩.

...

讯飞吹的是模型,华为吹的是算力,回复两段话说的是两件事,不要混为一谈。


算力是可以堆的,只要数量足够多,三十年前的处理器算力加起来也能超越最新的i9,但做同样的事情,它们消耗的电力是新i9的几十上百倍。而训练llm最大的成本就是电力,如果其它厂家能用6nm甚至3nm,而华为只能用22,那么其它条件一样的情况下它一定竞争不过那些厂家,这个是物理规律,再怎么不甘心也没用的。手机芯片也是一样,所以华为才要自己全力突破冲FAB~
回复

使用道具 举报

     
发表于 2023-8-27 00:03 | 显示全部楼层
yesicant 发表于 2023-8-26 23:45
国内大模型从来不是突然出现,只是之前这行没什么人关注,可以说AI整个世界只有中美有比较完整的上下游产学 ...

deepmind表示很淦……手持stable diffusion的慕尼黑某校表示很淦……苏黎世理工表示我们神马都不知道……
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-27 00:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-8-27 00:12 来自手机 | 显示全部楼层
升腾900是2019年的产品了...当年就和A100算力差不多,用的是台积电7nm生产。不知道华为现在出货的是存货还是别的什么玩意儿,另外今年有一些升腾升级换代的消息
训练这块算力多少影响的无非是效率问题,直接影响应用的推理这边现在模型开始往MOE走了以后主要的瓶颈在带宽这边。这方面黄老板的nvlink优势还是挺大的

—— 来自 samsung SM-S9180, Android 13上的 S1Next-鹅版 v2.5.2-play
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-27 00:15 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-8-27 00:28 来自手机 | 显示全部楼层
燕山雪 发表于 2023-8-26 23:54
讯飞吹的是模型,华为吹的是算力,回复两段话说的是两件事,不要混为一谈。

这个你不用担心,制裁不彻底等于彻底不制裁,euv光刻机国内做ai芯片的应该一家也用不上
回复

使用道具 举报

     
发表于 2023-8-27 00:32 | 显示全部楼层
LHO 发表于 2023-8-27 00:15
https://www.hisilicon.com/cn/products/Ascend/Ascend-310
https://www.hisilicon.com/cn/products/Asce ...

华为2020年就被封锁了,现在是2023年……
回复

使用道具 举报

     
发表于 2023-8-27 00:34 | 显示全部楼层
wuuuuuud 发表于 2023-8-27 00:28
这个你不用担心,制裁不彻底等于彻底不制裁,euv光刻机国内做ai芯片的应该一家也用不上 ...

几家初创GPU公司基本都在走7nm,好几家都回来了,能不能量产另说
回复

使用道具 举报

     
发表于 2023-8-27 00:47 | 显示全部楼层
燕山雪 发表于 2023-8-27 00:03
deepmind表示很淦……手持stable diffusion的慕尼黑某校表示很淦……苏黎世理工表示我们神马都不知道…… ...

人家完全没说错好么, 国内BAT都在做自己的LLM, GPT-2那个时代就开始模仿刷分了
有没有和水平怎么样是两码事

评分

参与人数 1战斗力 +1 收起 理由
燕山雪 + 1 看我52楼

查看全部评分

回复

使用道具 举报

     
发表于 2023-8-27 01:35 来自手机 | 显示全部楼层
本帖最后由 wfefe 于 2023-8-27 02:05 编辑
燕山雪 发表于 2023-8-27 00:32
华为2020年就被封锁了,现在是2023年……

这两年国内不少数据中心和AI模型都用到了昇腾910,如果全是库存货的话,那大家都去松山湖打捞吧。

而且目前猜测讯飞用的是新出的昇腾910b,我看微博七月份就有人说910b已经被商用了。

—— 来自 HONOR REP-AN00, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

头像被屏蔽
发表于 2023-8-27 02:44 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-8-27 03:49 | 显示全部楼层

俺寻思这玩意也不是第一天出来了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-8-27 08:29 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 10:49 , Processed in 0.194417 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表