nemo_snowman 发表于 2024-3-22 21:19

龙芯6600架构超越Zen3

https://www.eefocus.com/article/1676098.html
最近,龙芯披露了3B6600的相关信息,有两个亮点,一个是CPU核大升级,另一个是集成了GPU。

首先看CPU性能。虽然命名为3B6600,看起来和龙芯3A6000都属于6000系列CPU,但实际上,3A6000与3B6600是两代架构,3A6000的IPC为17/G,3B6600的IPC达到20/G。在主频上,3B6600为2.6Ghz-3Ghz,3B6600的SPEC06成绩为52至60分。

其次看GPU。过去,龙芯把GPU集成在桥片中,主要是为了降低流片风险。本次将GPU集成到CPU中,说明了lg200在可靠性和成熟度上已经达到了要求,且龙芯对gpu的性能也较满意。

另外,3B6600还集成了集成pcie4.0、ddr5,都较3A6000有所升级。

由于当下英特尔、AMD主流的CPU的单核性能也就60+分,龙芯3B6600即便主频只有2.6Ghz,52分的性能对于日常办公已经是性能明显过剩了。

当下,市场上已经有龙芯6000+摩尔线程S30+16G+1T的电脑,售价3000元,这个配置和性能完全能够胜任办公电脑。

下一步,龙芯6600+16G+1T的电脑,如果能控制在2500元以内,就达到商业市场的门槛了。只要配上高性能显卡,都可以打3A游戏了。
有鉴于大陆已经有7nm工艺了,下一代的7000系列只要换工艺把主频做到3Ghz-3.5Ghz,龙芯在单核性能上的补课就基本完成了。之后就是堆核心数,出服务器CPU,以及不断完善软件生态和产业生态。


进步这么快,龙芯内部是两个组并行开发的吗?
看来5年内全国产电脑进入消费者市场不是做梦啊

kuleisite1992 发表于 2024-3-22 21:31

被子十三 发表于 2024-3-22 21:34

龙芯不是MIPS吗?怎么打游戏?

— from OnePlus KB2005, Android 14 of S1 Next Goose v2.5.2-play

精钢魔像 发表于 2024-3-22 21:41

被子十三 发表于 2024-3-22 21:34
龙芯不是MIPS吗?怎么打游戏?

— from OnePlus KB2005, Android 14 of S1 Next Goose v2.5.2-play ...

指令转译。操作系统那边用wine

weironx 发表于 2024-3-22 22:06

我还在用zen呢

acalephs 发表于 2024-3-22 22:35

被子十三 发表于 2024-3-22 05:34
龙芯不是MIPS吗?怎么打游戏?

— from OnePlus KB2005, Android 14 of S1 Next Goose v2.5.2-play ...

是loongarch哦
mips已经亡了

—— 来自 samsung SM-X710, Android 14上的 S1Next-鹅版 v2.5.4

UNICORN00 发表于 2024-3-22 22:44

别急,貌似目前显卡只支持到rx580?

ryanz 发表于 2024-3-22 22:49

"主频只有2.6Ghz" "性能明显过剩"
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已经很难用了。

ZEEROKAMI 发表于 2024-3-22 22:55

kuleisite1992 发表于 2024-3-22 21:31
先别急,货出来了再说。
国内最近这些厂子一个比一个能吹。
货不到手用自己的程序实测我是不信的。


因为要吸引资金

kuleisite1992 发表于 2024-3-22 22:56

Midnight.Coup 发表于 2024-3-22 23:33

龙芯的SPEC06成绩不是定向优化的嘛

骆宾王 发表于 2024-3-23 00:23

ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...

我笔记本的5800H为了风扇不吵锁到2.733Ghz,完全不卡。。。

0WHan0 发表于 2024-3-23 02:10

Midnight.Coup 发表于 2024-3-22 23:33
龙芯的SPEC06成绩不是定向优化的嘛

17的成绩又不是没有,也不差

unlsycn 发表于 2024-3-23 09:17

Midnight.Coup 发表于 2024-3-22 23:33
龙芯的SPEC06成绩不是定向优化的嘛

谁家不做定向优化呢

银光闪耀 发表于 2024-3-23 09:34

kuleisite1992 发表于 2024-3-22 21:31
先别急,货出来了再说。
国内最近这些厂子一个比一个能吹。
货不到手用自己的程序实测我是不信的。

3A6000已经出货了
测下来同频ipc的确能打,甚至有些项目能打12代p核
不过主频上不去,这些消息也没回避这个问题

kuleisite1992 发表于 2024-3-23 09:57

sunbeach 发表于 2024-3-23 10:02

kuleisite1992 发表于 2024-3-23 09:57
3A6000那个SPEC17分数帖子还是我转的。

问题是20分,我看有些人还要吹22分/G

还有个能耗比呢

银光闪耀 发表于 2024-3-23 10:11

kuleisite1992 发表于 2024-3-23 09:57
3A6000那个SPEC17分数帖子还是我转的。

问题是20分,我看有些人还要吹22分/G


loongarch又没历史包袱
而且3a6000ipc已经让很多人大跌眼镜了

况且各家设计重心并不一样
m系那是soc,考虑的东西cpu性能只是其中一项,龙芯这个可不一样

银光闪耀 发表于 2024-3-23 10:14

加上a17pro大砍cpu面积,说明更在乎晶片坪效cpu慢慢挤就行了

R.I.P 发表于 2024-3-23 10:57

ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...
和8250u比的话考虑转译开销以后ipc的优势估计还有剩,而且wps本来就有loongarch的binary

第八协奏曲 发表于 2024-3-23 11:20

99%的行政单位电脑就写表格,cpu早不是问题

问题在那些国产系统的软件兼容性

我现在倒是看好鸿蒙pc版

—— 来自 meizu MEIZU 18 Pro, Android 13上的 S1Next-鹅版 v2.5.4

第八协奏曲 发表于 2024-3-23 11:21

本帖最后由 第八协奏曲 于 2024-3-23 11:22 编辑

ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...

你看看是不是散热不行降频了

wps,就是i5-750这样的老古董配上16g内存和ssd都没问题



—— 来自 meizu MEIZU 18 Pro, Android 13上的 S1Next-鹅版 v2.5.4

7776169 发表于 2024-3-23 11:34

我想看实际运行的测试啊,啥时候有

—— 来自 OnePlus GM1900, Android 10上的 S1Next-鹅版 v2.5.2-play

ryanz 发表于 2024-3-23 13:13

第八协奏曲 发表于 2024-3-23 11:21
你看看是不是散热不行降频了

wps,就是i5-750这样的老古董配上16g内存和ssd都没问题

这个8250u的放老家拿来给电视放电影了,等啥时候回家看看温度,我还真没关心过这个,毕竟功耗低就没往那边想。

ycjiang1337 发表于 2024-3-23 13:14

ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...

SkyLake IPC本来也就那么回事

橋白 发表于 2024-3-23 13:40

真只有m2也够用的吧 政企不就是office n件套加网页加一堆内部开发工具 兼容性搞好了就算过关了吧

广东侠 发表于 2024-3-23 14:00

不是龙芯进步快,是行业主流ipc都在原地踏步,我甚至觉得最终各家ipc都会停在某一个特殊节点众生平等

银光闪耀 发表于 2024-3-23 14:43

橋白 发表于 2024-3-23 13:40
真只有m2也够用的吧 政企不就是office n件套加网页加一堆内部开发工具 兼容性搞好了就算过关了吧 ...

m2就有12600的水平了,单核还更强

welcom 发表于 2024-3-23 14:53

广东侠 发表于 2024-3-23 14:00
不是龙芯进步快,是行业主流ipc都在原地踏步,我甚至觉得最终各家ipc都会停在某一个特殊节点众生平等 ...

改IPC计算公式就是了,数字游戏还不是分分钟

unlsycn 发表于 2024-3-23 21:21

kuleisite1992 发表于 2024-3-23 09:57
3A6000那个SPEC17分数帖子还是我转的。

问题是20分,我看有些人还要吹22分/G


龙芯的微结构设计水平在国内确实是第一梯队的了。汪文祥去年在国科大给博士生上课的时候说香山的微结构可能会遇到瓶颈,言下之意是龙芯已经突破了这个瓶颈。
当时3A6000和昆明湖的跑分都是15分/G左右,后面就听说新架构到了20分/G。当然我当时觉得是吹的现在看可能确有其事。

wewai 发表于 2024-3-24 17:56

谁说 2017 就不能优化了 ...

W.K0n9 发表于 2024-3-25 13:25

龙芯要进消费级市场,性能反倒是影响最小的那一环吧LoongArch架构下只能用Linux系统就足够劝退很大很大一批人了,结果你这个Linux现在也搞得不利索,旧世界生态不知道什么时候能完成迁移,更别提很多软件也不支持LoongArch,总不能消费级市场也要求用户能自己动手跑编译吧

—— 来自 samsung SM-G9910, Android 14上的 S1Next-鹅版 v2.5.4

卖哥 发表于 2024-3-25 14:26

W.K0n9 发表于 2024-3-25 13:25
龙芯要进消费级市场,性能反倒是影响最小的那一环吧LoongArch架构下只能用Linux系统就足够劝退很大 ...

龙架构指令集里有800条是拿来提高转译效率的。

chih12 发表于 2024-3-25 14:28

刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。

wewai 发表于 2024-3-25 18:07

chih12 发表于 2024-3-25 14:28
刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。

...

感觉这个说得挺迷糊的。

先把上下文贴全 https://zhihu.com/question/356734743/answer/905462604 ARM架构怎样设计才能在指令执行性能上超越X86架构? - 北极的回答 - 知乎

弱内存序软件难写是确定的,但是性能是不是一定会弱是不一定的。

一开始他说 ARM 有偷工减料的嫌疑,我觉得倒是他自己有误导读者的嫌疑。因为现代处理器的 IPC 性能之源之一就是 reorder,允许更多的 reorder 才能允许更多的优化,而优化必然要做额外的设计和元件,怎么能叫“偷工减料”呢?
这个表儿他好像贴过不止一次,里面 SPARC,POWER 和 IA-64 等都是为高性能而生的架构,Alpha 更是如此,Alpha 这玩意儿留到现在的名声恰好基本就只有俩,一个是(同时代)极高的性能,另一个就是前无古人后无来者史上最魔幻的内存模型。这俩之间是有一定的内在联系的。

从性能角度来说,硬件最好能被精确地优化和控制。比如在一个多线程程序里,大多数内存访问其实是不需要做多线程同步的,只有少数涉及到多线程同步。那么理想情况下,硬件提供的接口应该能够允许在 common case 下不要额外做多线程同步的工作,只对软件明确指定的小部分操作进行同步。
作者似乎认为只是功耗高点无所谓,但是处理器设计现在是非常精细的一个领域,弱内存序的架构可以把保持一致性所花的能耗和晶体管,用到各种其他的优化、提频、提高续航上。主流 x86 实现在能耗比上处于二流水平,已经限制了很多领域的发挥(甚至可以说只有桌面 PC 是不怎么受影响的,这反而是个 exception)。
弱内存序架构给软件提供了这种选择,而强内存序架构没有。
这某种程度也是 RISC 所代表的模式神奇之处:less is more

至于他后面说 IO 的问题我也不觉得有什么依据:当你的 workload 是 IO-bound 时,多执行几个指令反而根本不是问题。实际上就算主要负载在核心,也经常使用为了绕过内存瓶颈多执行几条指令,为了避免分支预测失败而多执行几条指令的优化手段。不同架构比不出明显的优势,也不像会存在明显的劣势的样子。
在消费端,虽然我一向觉得推土机理论上就够用,但考虑到现在应用软件的稀烂现状,CPU 单核性能(指考虑了频率的最终单核性能)的重要性不会下降,至少要做到一个基本的 baseline 水平(比如 SKL)。真的有人用推土机跑 B 站,114514 个 Electron,摇了要跳广告不摇还是要跳广告的 3A 大作么?

另一个数据:这答案是 19 年的,差不多一年之后林檎就发布了 M1,实际表现“非常不友好”么?

卖哥 发表于 2024-3-25 22:36

chih12 发表于 2024-3-25 14:28
刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。

...

同样指令吞吐量的情况下,X86的性能更强,但是ARM的指令吞吐量可以做到领先X86很多。

wewai 发表于 2024-3-25 23:10

卖哥 发表于 2024-3-25 22:36
同样指令吞吐量的情况下,X86的性能更强,但是ARM的指令吞吐量可以做到领先X86很多。 ...

这也是非常刻板印象的结论,大多数应用使用的指令方面,大家现在区别不大。

最权威的金坷拉几年前就给过答案了,ISA 没那么重要。

chipsandcheese.com/2021/07/13/arm-or-x86-isa-doesnt-matter ARM or x86? ISA Doesn’t Matter – Chips and Cheese

acalephs 发表于 2024-3-26 01:01

十几甚至二十年前ALPHA、MIPS、POWER和SPARC一众老RISC开始走向凉凉的时候就有结论了,ISA对CPU综合性能的影响根本不重要,具体设计细节和上层软件应用决定一切。否则RISC纸面上那么美,怎么就干不过X86这种笨重CISC呢?
现在ARM、RISC-V和X86不过是再重复一遍。

phorcys02 发表于 2024-3-26 01:50

UNICORN00 发表于 2024-3-22 22:44
别急,貌似目前显卡只支持到rx580?

你在说啥?



phorcys02 发表于 2024-3-26 01:59

chih12 发表于 2024-3-25 14:28
刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。

...

现在的IO,本质不就是内存和总线么
这回答都2019年的事儿了,那时候龙芯的 内存控制器自己搓的比较烂,被人抓着喷
总线还用HT,也被抓着喷
内存控制器3a6000已经修好了,ddr4 吞吐和 i a的 基本一致,当然不支持xmp,上限不如i/a高阶主板+特挑的条子
总线 3c6000开始用自研lcl+pcie 4.0 也没啥毛病了,下一代3b6600也是这个配置
页: [1] 2
查看完整版本: 龙芯6600架构超越Zen3