龙芯6600架构超越Zen3
https://www.eefocus.com/article/1676098.html最近,龙芯披露了3B6600的相关信息,有两个亮点,一个是CPU核大升级,另一个是集成了GPU。
首先看CPU性能。虽然命名为3B6600,看起来和龙芯3A6000都属于6000系列CPU,但实际上,3A6000与3B6600是两代架构,3A6000的IPC为17/G,3B6600的IPC达到20/G。在主频上,3B6600为2.6Ghz-3Ghz,3B6600的SPEC06成绩为52至60分。
其次看GPU。过去,龙芯把GPU集成在桥片中,主要是为了降低流片风险。本次将GPU集成到CPU中,说明了lg200在可靠性和成熟度上已经达到了要求,且龙芯对gpu的性能也较满意。
另外,3B6600还集成了集成pcie4.0、ddr5,都较3A6000有所升级。
由于当下英特尔、AMD主流的CPU的单核性能也就60+分,龙芯3B6600即便主频只有2.6Ghz,52分的性能对于日常办公已经是性能明显过剩了。
当下,市场上已经有龙芯6000+摩尔线程S30+16G+1T的电脑,售价3000元,这个配置和性能完全能够胜任办公电脑。
下一步,龙芯6600+16G+1T的电脑,如果能控制在2500元以内,就达到商业市场的门槛了。只要配上高性能显卡,都可以打3A游戏了。
有鉴于大陆已经有7nm工艺了,下一代的7000系列只要换工艺把主频做到3Ghz-3.5Ghz,龙芯在单核性能上的补课就基本完成了。之后就是堆核心数,出服务器CPU,以及不断完善软件生态和产业生态。
进步这么快,龙芯内部是两个组并行开发的吗?
看来5年内全国产电脑进入消费者市场不是做梦啊 先别急,货出来了再说。
国内最近这些厂子一个比一个能吹。
货不到手用自己的程序实测我是不信的。
急功近利的厂子太多了,比如天兵科技7台改9台,单台推力还降了,当初ppt画的那么好看,真是艹了。 龙芯不是MIPS吗?怎么打游戏?
— from OnePlus KB2005, Android 14 of S1 Next Goose v2.5.2-play 被子十三 发表于 2024-3-22 21:34
龙芯不是MIPS吗?怎么打游戏?
— from OnePlus KB2005, Android 14 of S1 Next Goose v2.5.2-play ...
指令转译。操作系统那边用wine 被子十三 发表于 2024-3-22 05:34
龙芯不是MIPS吗?怎么打游戏?
— from OnePlus KB2005, Android 14 of S1 Next Goose v2.5.2-play ...
是loongarch哦
mips已经亡了
—— 来自 samsung SM-X710, Android 14上的 S1Next-鹅版 v2.5.4 别急,貌似目前显卡只支持到rx580? "主频只有2.6Ghz" "性能明显过剩"
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已经很难用了。 kuleisite1992 发表于 2024-3-22 21:31
先别急,货出来了再说。
国内最近这些厂子一个比一个能吹。
货不到手用自己的程序实测我是不信的。
因为要吸引资金 友情提醒,8cxgen3单核跑CPU-Z也有543分,多核3400
实际体验大家有目共睹,不配给5600H提鞋 龙芯的SPEC06成绩不是定向优化的嘛 ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...
我笔记本的5800H为了风扇不吵锁到2.733Ghz,完全不卡。。。 Midnight.Coup 发表于 2024-3-22 23:33
龙芯的SPEC06成绩不是定向优化的嘛
17的成绩又不是没有,也不差 Midnight.Coup 发表于 2024-3-22 23:33
龙芯的SPEC06成绩不是定向优化的嘛
谁家不做定向优化呢 kuleisite1992 发表于 2024-3-22 21:31
先别急,货出来了再说。
国内最近这些厂子一个比一个能吹。
货不到手用自己的程序实测我是不信的。
3A6000已经出货了
测下来同频ipc的确能打,甚至有些项目能打12代p核
不过主频上不去,这些消息也没回避这个问题 本帖最后由 kuleisite1992 于 2024-3-23 10:01 编辑
银光闪耀 发表于 2024-3-23 09:34
3A6000已经出货了
测下来同频ipc的确能打,甚至有些项目能打12代p核
不过主频上不去,这些消息也没回避这 ...
3A6000那个SPEC17分数帖子还是我转的。
问题是20分,我看有些人还要吹22分/G
这是什么概念。
M2也就这个分数。
3B6600如果照着这个吹的8C16T 2.6-3G,如果再和3A6000一样稍微放开一点超频,让人能拉个10-15%的频率(比如现在一群人都在2.8G玩3A6000)
那就是3G-3.45G,能去找M2 Pro玩耍去了。
即使是SPECint2017的分数,现在是5分/2.5G,真照这个说法,单核性能提升20-30%,那就是6-6.5分/2.5G,再算上我刚才说的频率,那也是8-9分的层次, 是足以和M1/5800X3D/6900HS系列玩耍的水平
12nm搓出来能和5nm有来有回的产品。
这啥概念啊。意思是龙芯这个小团队内核设计功底按着费拉不堪的applesilicon团队打。这有点违反常识了。
kuleisite1992 发表于 2024-3-23 09:57
3A6000那个SPEC17分数帖子还是我转的。
问题是20分,我看有些人还要吹22分/G
还有个能耗比呢 kuleisite1992 发表于 2024-3-23 09:57
3A6000那个SPEC17分数帖子还是我转的。
问题是20分,我看有些人还要吹22分/G
loongarch又没历史包袱
而且3a6000ipc已经让很多人大跌眼镜了
况且各家设计重心并不一样
m系那是soc,考虑的东西cpu性能只是其中一项,龙芯这个可不一样 加上a17pro大砍cpu面积,说明更在乎晶片坪效cpu慢慢挤就行了 ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...
和8250u比的话考虑转译开销以后ipc的优势估计还有剩,而且wps本来就有loongarch的binary 99%的行政单位电脑就写表格,cpu早不是问题
问题在那些国产系统的软件兼容性
我现在倒是看好鸿蒙pc版
—— 来自 meizu MEIZU 18 Pro, Android 13上的 S1Next-鹅版 v2.5.4 本帖最后由 第八协奏曲 于 2024-3-23 11:22 编辑
ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...
你看看是不是散热不行降频了
wps,就是i5-750这样的老古董配上16g内存和ssd都没问题
—— 来自 meizu MEIZU 18 Pro, Android 13上的 S1Next-鹅版 v2.5.4 第八协奏曲 发表于 2024-3-23 11:21
你看看是不是散热不行降频了
wps,就是i5-750这样的老古董配上16g内存和ssd都没问题
这个8250u的放老家拿来给电视放电影了,等啥时候回家看看温度,我还真没关心过这个,毕竟功耗低就没往那边想。 ryanz 发表于 2024-3-22 22:49
就算 x86,主频 2.6 Ghz,wps 都会卡吧,我的那台windows 笔记本 i5-8250u 1.6Ghz 睿频 3.2Ghz 我都感觉已 ...
SkyLake IPC本来也就那么回事
真只有m2也够用的吧 政企不就是office n件套加网页加一堆内部开发工具 兼容性搞好了就算过关了吧 不是龙芯进步快,是行业主流ipc都在原地踏步,我甚至觉得最终各家ipc都会停在某一个特殊节点众生平等 橋白 发表于 2024-3-23 13:40
真只有m2也够用的吧 政企不就是office n件套加网页加一堆内部开发工具 兼容性搞好了就算过关了吧 ...
m2就有12600的水平了,单核还更强 广东侠 发表于 2024-3-23 14:00
不是龙芯进步快,是行业主流ipc都在原地踏步,我甚至觉得最终各家ipc都会停在某一个特殊节点众生平等 ...
改IPC计算公式就是了,数字游戏还不是分分钟 kuleisite1992 发表于 2024-3-23 09:57
3A6000那个SPEC17分数帖子还是我转的。
问题是20分,我看有些人还要吹22分/G
龙芯的微结构设计水平在国内确实是第一梯队的了。汪文祥去年在国科大给博士生上课的时候说香山的微结构可能会遇到瓶颈,言下之意是龙芯已经突破了这个瓶颈。
当时3A6000和昆明湖的跑分都是15分/G左右,后面就听说新架构到了20分/G。当然我当时觉得是吹的现在看可能确有其事。 谁说 2017 就不能优化了 ...
龙芯要进消费级市场,性能反倒是影响最小的那一环吧LoongArch架构下只能用Linux系统就足够劝退很大很大一批人了,结果你这个Linux现在也搞得不利索,旧世界生态不知道什么时候能完成迁移,更别提很多软件也不支持LoongArch,总不能消费级市场也要求用户能自己动手跑编译吧
—— 来自 samsung SM-G9910, Android 14上的 S1Next-鹅版 v2.5.4 W.K0n9 发表于 2024-3-25 13:25
龙芯要进消费级市场,性能反倒是影响最小的那一环吧LoongArch架构下只能用Linux系统就足够劝退很大 ...
龙架构指令集里有800条是拿来提高转译效率的。 刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。
chih12 发表于 2024-3-25 14:28
刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。
...
感觉这个说得挺迷糊的。
先把上下文贴全 https://zhihu.com/question/356734743/answer/905462604 ARM架构怎样设计才能在指令执行性能上超越X86架构? - 北极的回答 - 知乎
弱内存序软件难写是确定的,但是性能是不是一定会弱是不一定的。
一开始他说 ARM 有偷工减料的嫌疑,我觉得倒是他自己有误导读者的嫌疑。因为现代处理器的 IPC 性能之源之一就是 reorder,允许更多的 reorder 才能允许更多的优化,而优化必然要做额外的设计和元件,怎么能叫“偷工减料”呢?
这个表儿他好像贴过不止一次,里面 SPARC,POWER 和 IA-64 等都是为高性能而生的架构,Alpha 更是如此,Alpha 这玩意儿留到现在的名声恰好基本就只有俩,一个是(同时代)极高的性能,另一个就是前无古人后无来者史上最魔幻的内存模型。这俩之间是有一定的内在联系的。
从性能角度来说,硬件最好能被精确地优化和控制。比如在一个多线程程序里,大多数内存访问其实是不需要做多线程同步的,只有少数涉及到多线程同步。那么理想情况下,硬件提供的接口应该能够允许在 common case 下不要额外做多线程同步的工作,只对软件明确指定的小部分操作进行同步。
作者似乎认为只是功耗高点无所谓,但是处理器设计现在是非常精细的一个领域,弱内存序的架构可以把保持一致性所花的能耗和晶体管,用到各种其他的优化、提频、提高续航上。主流 x86 实现在能耗比上处于二流水平,已经限制了很多领域的发挥(甚至可以说只有桌面 PC 是不怎么受影响的,这反而是个 exception)。
弱内存序架构给软件提供了这种选择,而强内存序架构没有。
这某种程度也是 RISC 所代表的模式神奇之处:less is more
至于他后面说 IO 的问题我也不觉得有什么依据:当你的 workload 是 IO-bound 时,多执行几个指令反而根本不是问题。实际上就算主要负载在核心,也经常使用为了绕过内存瓶颈多执行几条指令,为了避免分支预测失败而多执行几条指令的优化手段。不同架构比不出明显的优势,也不像会存在明显的劣势的样子。
在消费端,虽然我一向觉得推土机理论上就够用,但考虑到现在应用软件的稀烂现状,CPU 单核性能(指考虑了频率的最终单核性能)的重要性不会下降,至少要做到一个基本的 baseline 水平(比如 SKL)。真的有人用推土机跑 B 站,114514 个 Electron,摇了要跳广告不摇还是要跳广告的 3A 大作么?
另一个数据:这答案是 19 年的,差不多一年之后林檎就发布了 M1,实际表现“非常不友好”么? chih12 发表于 2024-3-25 14:28
刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。
...
同样指令吞吐量的情况下,X86的性能更强,但是ARM的指令吞吐量可以做到领先X86很多。 卖哥 发表于 2024-3-25 22:36
同样指令吞吐量的情况下,X86的性能更强,但是ARM的指令吞吐量可以做到领先X86很多。 ...
这也是非常刻板印象的结论,大多数应用使用的指令方面,大家现在区别不大。
最权威的金坷拉几年前就给过答案了,ISA 没那么重要。
chipsandcheese.com/2021/07/13/arm-or-x86-isa-doesnt-matter ARM or x86? ISA Doesn’t Matter – Chips and Cheese 十几甚至二十年前ALPHA、MIPS、POWER和SPARC一众老RISC开始走向凉凉的时候就有结论了,ISA对CPU综合性能的影响根本不重要,具体设计细节和上层软件应用决定一切。否则RISC纸面上那么美,怎么就干不过X86这种笨重CISC呢?
现在ARM、RISC-V和X86不过是再重复一遍。 UNICORN00 发表于 2024-3-22 22:44
别急,貌似目前显卡只支持到rx580?
你在说啥?
chih12 发表于 2024-3-25 14:28
刚好看到一个喷 arm 的回答,顺带啐了龙芯。跑分这事真的看看就好,AMD 搞推土机已经骗过一波韭菜了。
...
现在的IO,本质不就是内存和总线么
这回答都2019年的事儿了,那时候龙芯的 内存控制器自己搓的比较烂,被人抓着喷
总线还用HT,也被抓着喷
内存控制器3a6000已经修好了,ddr4 吞吐和 i a的 基本一致,当然不支持xmp,上限不如i/a高阶主板+特挑的条子
总线 3c6000开始用自研lcl+pcie 4.0 也没啥毛病了,下一代3b6600也是这个配置