移动ZEN2 APU大部分型号了。。。。泄露了，CES 2020见 - 第2页 - ＰＣ数码 - Stage1st

EraserKing 发表于 2019-12-25 12:56

CyanCloverFern 发表于 2019-12-25 10:48
这种移动高算力上准系统。传统笔电不支持，供电都跟不上。

现在跑满4C8T就能算移动高算力了？

CyanCloverFern 发表于 2019-12-25 13:12

EraserKing 发表于 2019-12-25 12:56
现在跑满4C8T就能算移动高算力了？

他要的16c

EraserKing 发表于 2019-12-25 13:33

本帖最后由 EraserKing 于 2019-12-25 13:37 编辑

CyanCloverFern 发表于 2019-12-25 13:12
他要的16c
折中一下，这个年代了，i7就该8C起步了
8650U真TM臭狗屎，还是稀烂的那种，臭味三公里外都闻得到

BTW 我是想回你“笔记本上要跑什么重度应用用到8c”这句

CyanCloverFern 发表于 2019-12-25 13:59

EraserKing 发表于 2019-12-25 13:33
折中一下，这个年代了，i7就该8C起步了
8650U真TM臭狗屎，还是稀烂的那种，臭味三公里外都闻得到

所以你在笔记本上跑什么耗费算力的应用。8C跑耗费算力的应用功耗在上百w了，笔记本模具有几个能压住的？

albertfu 发表于 2019-12-25 13:59

CyanCloverFern 发表于 2019-12-25 12:31
感谢AMD为大家榨牙膏管。。。。。。

后来仔细算了算，泄露源IPC说比Ice Lake提升了5-8%

已知今年10月出的Ice Lake IPC赶上了Zen2，比祖传SKL提升了18%，可惜频率劣势导致性能不如SKL，所以没法上桌面

那随着现在具体频率和IPC都未知的Zen3（明年夏天）和频率未知的Tiger Lake（明年秋天）铺货，后年的CPU市场真的会是一场好戏

CyanCloverFern 发表于 2019-12-25 14:04

本帖最后由 CyanCloverFern 于 2019-12-25 14:06 编辑

albertfu 发表于 2019-12-25 13:59
后来仔细算了算，泄露源IPC说比Ice Lake提升了5-8%

已知今年10月出的Ice Lake IPC赶上了Zen2，比祖传SKL ...
Skylake与zen2同IPC，看SPEC数据。网上各种跑R15来算IPC的不能信，软件太老。真打赢了不至于EPYC出货4%一年在服务器市场。

RPG-7 发表于 2019-12-25 14:06

icelake不咋样啊，同样的25w和14nm的五五开，但频率低，这有啥用

Radeon 发表于 2019-12-25 14:09

albertfu 发表于 2019-12-25 14:11

CyanCloverFern 发表于 2019-12-25 14:04
Skylake与zen2同IPC，看SPEC数据。网上各种跑R15来算IPC的不能信，软件太老。真打赢了不至于EPYC出货4%一 ...

就算是看spec2017，SKL哪来的和zen2同IPC。。。。。。。

服务器市场分析的很多了，2倍于牙膏的perf/watt还只有这点市占率明显不是产品力的问题，而是市场惯性巨大，导致牙膏漏洞频出带来的性能损失，最经济的方案是买更多的漏洞牙膏而不是全部换新

CyanCloverFern 发表于 2019-12-25 14:18

Radeon 发表于 2019-12-25 14:09
你那里看的zen2和skl同IPC的？

你多搜索搜索呗，business的浏览器屏蔽的网站过多没法给你来源。

EraserKing 发表于 2019-12-25 14:22

CyanCloverFern 发表于 2019-12-25 13:59
所以你在笔记本上跑什么耗费算力的应用。8C跑耗费算力的应用功耗在上百w了，笔记本模具有几个能压 ...

8C能上百W？那只能说14nm+++抠脚了……隔壁TDP也就标个65W/95W，还是桌面版……

真的，不要以为一听笔记本要8C就以为是要搞算力比如炼丹什么的
我就告诉你4C下面挂几个后台服务，再编译点东西或者多开几个应用这样的稍微重点的负载，基本上就是全程100%占用，风扇转得隔几个工位都听得见

Radeon 发表于 2019-12-25 14:22

CyanCloverFern 发表于 2019-12-25 14:26

本帖最后由 CyanCloverFern 于 2019-12-25 14:52 编辑

EraserKing 发表于 2019-12-25 14:22
8C能上百W？那只能说14nm+++抠脚了……隔壁TDP也就标个65W/95W，还是桌面版……

真的，不要以为一听笔记 ...
TDP标的能当真就好了或者你跑的不是耗算力的应用。100%占用是调度给了100%, 又不是日常应用，也是你在使用笔记本的缘故, 想风扇转慢的降压。(你看你4C都压不住了，上8C岂不是直接过热关机，重度应用远离笔记本)
供电散热跟不上跑8c可以和mac一样疯狂掉频。

j0n2 发表于 2019-12-25 14:40

EraserKing 发表于 2019-12-25 15:08

CyanCloverFern 发表于 2019-12-25 14:26
TDP标的能当真就好了或者你跑的不是耗算力的应用。100%占用是调度给了100%, 又不是日常应用，也是 ...
笔记本上面怎么不当真了，PL1往往都是跟着TDP走的，TDP大概指代个默频下的功耗也差不了多少，问题是14nm+++下面随随便便功耗就飞天了，TDP虚标在台式机上面大家也就认了，笔记本怎么办，不睿频吧那可怜的频率就还是三秒真男人，睿频吧，功耗爆炸散热也架不住啊
所以早日10nm新架构早日重获新生

至于后半段，什么乱七八糟的，VS编译一跑起来，几个线程并行编译，没几下就掉到1.9G，然后就是肉眼可见的降频卡顿，风扇起飞
至于降压，降压是不可能降压的，这辈子都不可能降压，公司配的傻多戴干活用的机器，又不是我自己的……

CyanCloverFern 发表于 2019-12-25 15:18

EraserKing 发表于 2019-12-25 15:08
笔记本上面怎么不当真了，PL1往往都是跟着TDP走的，TDP大概指代个默频下的功耗也差不了多少，问题是14nm++ ...
傻多戴的本子散热真是一把泪，除了今年的Area系列。。。。。。
跑满100%就算换到10nm也一样风扇起飞。
可以考虑买个静音耳机，编译的时候泡杯茶。

EraserKing 发表于 2019-12-25 15:41

CyanCloverFern 发表于 2019-12-25 15:18
傻多戴的本子散热真是一把泪，除了今年的Area系列。。。。。。
跑满100%就算换到10nm也一样风扇起飞。
可 ...

同样15W TDP，14nm+++ 4C基频1.9，10nm+ICL/TGL下总要比这个强吧，比这还差那就说明牙膏厂早日倒闭好了，别XJB吹了
不能说风扇起飞就是臭狗屎，但是不管是提频也好，加核也好，能减少起飞时段就行

sakuraNTET 发表于 2019-12-25 15:45

7700hq哭晕在厕所，所幸1070还能坚持几年

—— 来自 Xiaomi Mi Note 3, Android 9上的 S1Next-鹅版 v2.2.0.1

CyanCloverFern 发表于 2019-12-25 15:52

EraserKing 发表于 2019-12-25 15:41
同样15W TDP，14nm+++ 4C基频1.9，10nm+ICL/TGL下总要比这个强吧，比这还差那就说明牙膏厂早日倒闭好了， ...

提频加核都会考验风扇的，合理方向是每时钟指令数，提升指令发射宽度深度。

creymorgan 发表于 2019-12-25 15:58

CyanCloverFern 发表于 2019-12-25 15:52
提频加核都会考验风扇的，合理方向是每时钟指令数，提升指令发射宽度深度。 ...

这其实和细分流水线减少每一级流水线内的门电路数是等效的。

EraserKing 发表于 2019-12-25 16:03

CyanCloverFern 发表于 2019-12-25 15:52
提频加核都会考验风扇的，合理方向是每时钟指令数，提升指令发射宽度深度。 ...

可以啊，问题是频率和核心数不能大退步拖后腿，要是像CNL-U那样丢人还是算了

CyanCloverFern 发表于 2019-12-25 16:06

本帖最后由 CyanCloverFern 于 2019-12-25 16:08 编辑

creymorgan 发表于 2019-12-25 15:58
这其实和细分流水线减少每一级流水线内的门电路数是等效的。
流水线级数上去后分支预测出错率惨不忍睹，英特尔犯过一次错之后出了酷睿，AMD然后出了各种农机，到Zen才算回归正轨

Gnyueh 发表于 2019-12-25 16:16

CyanCloverFern 发表于 2019-12-25 16:06
流水线级数上去后分支预测出错率惨不忍睹，英特尔犯过一次错之后出了酷睿，AMD然后出了各种农机，到Zen才 ...

不是分支预测率而是分支预测清空流水线的惩罚，现在intel的CPU流水线级数还是越来越长的，ZEN比intel最长的Sunny cove还长一点

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

CyanCloverFern 发表于 2019-12-25 16:20

Gnyueh 发表于 2019-12-25 16:16
不是分支预测率而是分支预测清空流水线的惩罚，现在intel的CPU流水线级数还是越来越长的，ZEN比intel最长 ...

每多一级流水线，出现分支预测出错的概率越大，表述没问题啊。。。。。。
最长那会流水线已经20多快30了，现在在14左右。

creymorgan 发表于 2019-12-25 17:15

CyanCloverFern 发表于 2019-12-25 16:06
流水线级数上去后分支预测出错率惨不忍睹，英特尔犯过一次错之后出了酷睿，AMD然后出了各种农机，到Zen才 ...

增宽也同样惨的呀。

你瞅啥？ 发表于 2019-12-25 17:24

不要吵架不要吵架谁说对了最yes的就是它
扯远了，本人预备2020年底组一台ITX专门看片和日常QQ刷网页做表格，其中看片需要可以硬解4K@60帧 10BIT4：4：4，完全不考虑显卡的情况下哪家的U合适？（单CPU预算1200以下）

EraserKing 发表于 2019-12-25 17:41

你瞅啥？发表于 2019-12-25 17:24
不要吵架不要吵架谁说对了最yes的就是它
扯远了，本人预备2020年底组一台ITX专门看片和日常QQ刷网页 ...

2200G都能硬解4K 60 10bit了吧，不过444不知道了
当然只是解，你说有没有余力再挂个madvr加补帧，大概就不行了

Gnyueh 发表于 2019-12-25 17:57

本帖最后由 Gnyueh 于 2019-12-25 18:35 编辑

CyanCloverFern 发表于 2019-12-25 16:20
每多一级流水线，出现分支预测出错的概率越大，表述没问题啊。。。。。。
最长那会流水线已经20多快30了 ...

分支错误率是有分支预测器相关的，和流水线长度没关，分支猜测只在流水线几级有执行，正确率由分支预测器设计决定(这个跟流水线长度没有必然关系)，流水线越长，分支错误重填流水线时间越长，Bubble就越多(奔腾四和超频农机这种30多级流水线太烂了不算现代处理器，ZEN的流水线在19左右，uop cache可以把惩罚降低到17(还是15?)，SKL的流水线大概在17

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

EraserKing 发表于 2019-12-25 18:12

CyanCloverFern 发表于 2019-12-25 16:20
每多一级流水线，出现分支预测出错的概率越大，表述没问题啊。。。。。。
最长那会流水线已经20多快30了 ...

分支预测出错的代价是清空流水线，流水线越长可以理解成代价越惨重
不要倒果为因了

两个路人 发表于 2019-12-25 18:23

太夏梵天 发表于 2019-12-25 18:32

Gnyueh 发表于 2019-12-25 18:33

太夏梵天发表于 2019-12-25 18:32
现在APU能插帧吗？7nmAPU据说很香

能

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

EraserKing 发表于 2019-12-25 19:32

两个路人发表于 2019-12-25 18:23
能解444的只有老黄图灵，然而笔记本电脑上，老黄的卡又不干解码的活

用独显跑播放器就行了吧

Radeon 发表于 2019-12-25 19:35

白头盔 发表于 2019-12-25 19:36

太夏梵天发表于 2019-12-25 18:32
现在APU能插帧吗？7nmAPU据说很香

插帧用spv专业版，很香了。不比a卡差。用intel集显就行。

EraserKing 发表于 2019-12-25 19:48

Radeon 发表于 2019-12-25 19:35
不能，老黄的移动卡根本屏蔽了视频编解码单元

DXVA原来现在都被开除出硬解行列了？

Radeon 发表于 2019-12-25 20:06

白头盔 发表于 2019-12-25 21:46

mx250确实。。。
好在uhd集显解码强大

CyanCloverFern 发表于 2019-12-26 00:58

本帖最后由 CyanCloverFern 于 2019-12-26 01:03 编辑

EraserKing 发表于 2019-12-25 18:12
分支预测出错的代价是清空流水线，流水线越长可以理解成代价越惨重
不要倒果为因了 ...
代码里那堆连续的ifelse不赞同你的观点。
不是人人都懂用？：来代替ifelse。
流水线长了同时在流水线里塞的分支也多了。一次预测正确率是p，那么总预测率是p^q。

Gnyueh 发表于 2019-12-26 01:25

CyanCloverFern 发表于 2019-12-26 00:58
代码里那堆连续的ifelse不赞同你的观点。
不是人人都懂用？：来代替ifelse。
流水线长了同时在流水线里塞 ...

C的无论是问号还是ifelse在x86汇编里面都会变成条件跳转的，这个没有什么区别，除非某些编译器优化成直接逻辑布尔操作或者avx512那种mask op，不必要大量的分支操作本身就是傻嗨行为，分支密度极低或者分支内指令数量长于流水线长度l的话只考虑分支流水线清空的Bubble就可以了，基本惩罚就是l*p*n(l流水线长度，p分支错误率，n分支次数)，如果分支密度很高，在假设极端一点，全部都是分支，这种情况下分支错误惩罚也为p*n*l，这还没有讨论多级分支预测器，以及分支预测器在连续分支下(由于分支短数据基本没有操作)，更好的预测效果，以及op cache效果的影响

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

页: 1 [2] 3

Stage1st's Archiver