魁北克大学教授：Zen 2架构IPC性能仅为4年前Skylake的67% - ＰＣ数码 - Stage1st

Radeon 发表于 2019-12-12 11:54

塔奇克马 发表于 2019-12-12 11:55

intel yes!

crazyt 发表于 2019-12-12 11:55

牙膏真的要不行了。

银光闪耀 发表于 2019-12-12 11:57

gofbayrf 发表于 2019-12-12 12:05

這值得交個朋友

小妻水亚美 发表于 2019-12-12 12:18

qazesz 发表于 2019-12-12 12:19

领先业界5、6年

KOGmk2 发表于 2019-12-12 12:24

本帖最后由 KOGmk2 于 2019-12-12 12:32 编辑

小妻水亚美发表于 2019-12-12 12:18
这教授后面几个牙膏厂的安全补丁没打吧

—— 来自 motorola XT1970-5, Android 9上的 S1Next-鹅版 v2.1.2 ...
不,他用的是极其精准的调整----专门写了个黑ZEN2的测试程序出来,起码值5W米刀朋友费,如果每家媒体都这个水准,那牙膏的30亿米刀朋友费真不够用
和NGAcn某个见A色变的版主一样~~~自己鬼知道用什么库的某个软件AU不如IU就出来天天念叨AU没有生产力

whzfjk 发表于 2019-12-12 12:31

KOGmk2 发表于 2019-12-12 12:34

whzfjk 发表于 2019-12-12 12:31
安全总要付出性能的代价，AMD的架构水平高出Intel那么多能够性能飞升还没有漏洞？Intel如果放下身段让台积 ...

太极殿的7nm达成频率并没比牙膏的10nm高太多,为了维持算力就是架构也得一起换掉,牙膏现在两面欠闲,同时换架构制程恐怕也得拖到21年,那为啥要换......

牙膏现在最需要的不是7nm,而是农企的高性能胶水

gofbayrf 发表于 2019-12-12 12:37

KOGmk2 发表于 2019-12-12 12:34
太极殿的7nm达成频率并没比牙膏的10nm高太多,为了维持算力就是架构也得一起换掉,牙膏现在两面欠闲,同时换 ...

我好奇 hedt平台的有沒有用上膠水？

KOGmk2 发表于 2019-12-12 12:39

本帖最后由 KOGmk2 于 2019-12-12 12:43 编辑

gofbayrf 发表于 2019-12-12 12:37
我好奇 hedt平台的有沒有用上膠水？
有,马上要出的56C112T就是两片28C56T的胶水,问题在于对面的农企旗舰是8x8,良率和成本优势把牙膏秒出一条街,但是农企这TDP给得太抠门导致频率不高,目前反而是3990X关注度更高~~~看Spec2006理论算力,7742也就是3970X的120%左右,而3990X理论算力起码是3970X的160%以上......农企这个频率不随核心增多显著下降/功耗也不随核心增多指数上升的强力胶水在拼核心和算力的领域简直是真大杀器

DeepFishing 发表于 2019-12-12 12:44

whzfjk 发表于 2019-12-12 12:31
安全总要付出性能的代价，AMD的架构水平高出Intel那么多能够性能飞升还没有漏洞？Intel如果放下身段让台积 ...

牙膏的CPU同频打不过农企了，换台积电意义不大，xxxxlake架构用的时间太长了，农企从上到下就一种计算die，可以针对优化

—— 来自 Sony H8296, Android 9上的 S1Next-鹅版 v2.1.2

kerorokun 发表于 2019-12-12 13:17

我就问下amd这个胶水延迟还大吗

albertfu 发表于 2019-12-12 13:25

仔细看了看这文就算真的是恰饭也是水平很高的那种恰饭

Thus “work per unit of time normalized per CPU frequency” and “instructions per cycle” are distinct notions.
一开始就写明了他测的IPC和市面上那些调到同频然后跑个分的不是一路货色

失身招领处 发表于 2019-12-12 13:25

kerorokun 发表于 2019-12-12 13:17
我就问下amd这个胶水延迟还大吗

这方面劣势还是很大。
家用机中高端能差出50%的延迟。
不过amd体积小能塞更多缓存进去，所以缓存大。

KOGmk2 发表于 2019-12-12 13:28

失身招领处发表于 2019-12-12 13:25
这方面劣势还是很大。
家用机中高端能差出50%的延迟。
不过amd体积小能塞更多缓存进去，所以缓存大。 ...

牙膏核心堆到农企这个等级延迟可能更严重.....单RING总线撑到10C20T已经很紧张了,MESH现在的表现还没农企的IF好

albertfu 发表于 2019-12-12 13:29

失身招领处发表于 2019-12-12 13:25
这方面劣势还是很大。
家用机中高端能差出50%的延迟。
不过amd体积小能塞更多缓存进去，所以缓存大。 ...

前几天看了个内存调小参之后的3950X vs 9900KS的评测视频，牙膏的内存延时还是叼，40ns只是起步，zen2 60ns都跑不进

这代的core to core延时记得倒是得益于那块iodie，比zen/zen+要强，一致性要更好

试制甲炮 发表于 2019-12-12 13:43

kerorokun 发表于 2019-12-12 13:17
我就问下amd这个胶水延迟还大吗

比zen1和zen+时候好多了。以前跨CCX延迟可以到120ns，现在（大约是承蒙封装技术的升级）已经压低到70ns水平，已经比intel 6-8核的ringbus总线最远核心的延迟要好了。

defer 发表于 2019-12-12 19:34

ring跑内存延迟当然漂亮，加到20c再用ring那还漂亮吗。

sblnrrk 发表于 2019-12-12 22:08

fcbjay 发表于 2019-12-12 22:41

albertfu 发表于 2019-12-12 13:25
仔细看了看这文就算真的是恰饭也是水平很高的那种恰饭

Thus “work per unit of time normalized per CPU...

意思Intel家指令效率高？

sdefrfg 发表于 2019-12-12 23:02

albertfu 发表于 2019-12-13 00:33

fcbjay 发表于 2019-12-12 22:41
意思Intel家指令效率高？

在一个不反映实际性能的角度刁钻的自制测试里IPC更高

Cityrat 发表于 2019-12-13 00:47

当年nv指导我们用最低端支持物理加速的显卡干a卡全家

whzfjk 发表于 2019-12-13 00:54

albertfu 发表于 2019-12-13 01:14

whzfjk 发表于 2019-12-13 00:54
这可是 cherry-pick 啊，教授不怕被喷吗（

毕竟不是正式发表，底下评论还是很和谐的

比如有人指出“你老说4年老架构老架构，但最新的牙膏也还是skylake啊”，教授也回复说“对，没错”，还有人指责说你是不是用了AVX512了，教授也耐心解答并没有了

albertfu 发表于 2019-12-13 01:17

Cityrat 发表于 2019-12-13 00:47
当年nv指导我们用最低端支持物理加速的显卡干a卡全家

牛逼，感觉和双核7350k吊打1800X，9350KF秒R5全家有的拼？

KOGmk2 发表于 2019-12-13 08:30

fcbjay 发表于 2019-12-12 22:41
意思Intel家指令效率高？

不是,他用的一个特定指令,执行这个指令的时候SLK是三堆栈,ZEN2是二堆栈,则ZEN2运算该指令时性能上限为SLK的67%......其实就是高端版本的测试AVX512

baiducaonima 发表于 2019-12-13 08:50

明年zen3就可以买了

hgfdsa 发表于 2019-12-13 08:52

说起来，明年a78的ipc只怕都要超过skl了吧

Realplayer 发表于 2019-12-13 08:53

KOGmk2 发表于 2019-12-13 08:30
不是,他用的一个特定指令,执行这个指令的时候SLK是三堆栈,ZEN2是二堆栈,则ZEN2运算该指令时性能上限为SLK ...

所以这就叫ipc？

gofbayrf 发表于 2019-12-13 08:59

Avx512那功耗談ipc有什麼用得看能耗比吧

KOGmk2 发表于 2019-12-13 09:17

本帖最后由 KOGmk2 于 2019-12-13 09:18 编辑

Realplayer 发表于 2019-12-13 08:53
所以这就叫ipc？
IPC其实本来就是个定义不那么精确的东西,说ZEN2 IPC略超SLK,一般来说就是用多个Spec2006这类公认度较高的软件取均值,但是这老家伙硬说在自己的应用环境下ZEN2的IPC不如SLK其实也不能把他怎么样了......和NGACN某个用鬼知道什么库的软件黑ZEN2不如HWL/强调AVX512跑分一个套路,不过是这个家伙水准更高一档罢了

所以我说这片文章的朋友费价值不止5W米刀----起码他是用了心去研究ZEN2/SLK的指令集的

sblnrrk 发表于 2019-12-13 09:23

小白无机酸 发表于 2019-12-13 09:27

albertfu 发表于 2019-12-13 01:17 引用:Cityrat 发表于 2019-12-13 00:47 当年nv指导我们用最低端支持物理加速的显卡干a卡全家牛逼，感觉和双核7350k吊打1800X，9350KF秒R5全家有的拼？

好像是9600GT击倒5870？

u96 发表于 2019-12-15 13:50

你还别说，昨天我测试计算软件，在mkl的加持下，默频的4790k能跟4.0的3600打的有来有回。
在数值上也近似这个教授的效果了。

—— 来自 HUAWEI HMA-AL00, Android 10上的 S1Next-鹅版 v2.2.0.1

Gnyueh 发表于 2019-12-15 14:10

u96 发表于 2019-12-15 13:50
你还别说，昨天我测试计算软件，在mkl的加持下，默频的4790k能跟4.0的3600打的有来有回。
在数值上也近似这 ...

mkl对AMD处理器默认只用SSE1

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

albertfu 发表于 2019-12-15 18:54

u96 发表于 2019-12-15 13:50
你还别说，昨天我测试计算软件，在mkl的加持下，默频的4790k能跟4.0的3600打的有来有回。
在数值上也近似这 ...

https://www.pugetsystems.com/labs/hpc/How-To-Use-MKL-with-AMD-Ryzen-and-Threadripper-CPU-s-Effectively-for-Python-Numpy-And-Other-Applications-1637/

建议去除MKL对AMD的debuff获得数倍性能提升呢

u96 发表于 2019-12-16 01:05

albertfu 发表于 2019-12-15 18:54
https://www.pugetsystems.com/labs/hpc/How-To-Use-MKL-with-AMD-Ryzen-and-Threadripper-CPU-s-Effecti ...

我就是看到了这个消息才做的这个测试，事实证明这个方法对我的软件无效，前后没有区别。我还得吃mkl的屎

—— 来自 HUAWEI HMA-AL00, Android 10上的 S1Next-鹅版 v2.2.0.1

页: [1] 2

Stage1st's Archiver