EraserKing 发表于 2019-12-25 12:56

CyanCloverFern 发表于 2019-12-25 10:48
这种移动高算力上准系统。传统笔电不支持,供电都跟不上。

现在跑满4C8T就能算移动高算力了?

CyanCloverFern 发表于 2019-12-25 13:12

EraserKing 发表于 2019-12-25 12:56
现在跑满4C8T就能算移动高算力了?

他要的16c

EraserKing 发表于 2019-12-25 13:33

本帖最后由 EraserKing 于 2019-12-25 13:37 编辑

CyanCloverFern 发表于 2019-12-25 13:12
他要的16c
折中一下,这个年代了,i7就该8C起步了
8650U真TM臭狗屎,还是稀烂的那种,臭味三公里外都闻得到

BTW 我是想回你“笔记本上要跑什么重度应用用到8c”这句

CyanCloverFern 发表于 2019-12-25 13:59

EraserKing 发表于 2019-12-25 13:33
折中一下,这个年代了,i7就该8C起步了
8650U真TM臭狗屎,还是稀烂的那种,臭味三公里外都闻得到



所以你在笔记本上跑什么耗费算力的应用。8C跑耗费算力的应用功耗在上百w了,笔记本模具有几个能压住的?

albertfu 发表于 2019-12-25 13:59

CyanCloverFern 发表于 2019-12-25 12:31
感谢AMD为大家榨牙膏管。。。。。。

后来仔细算了算,泄露源IPC说比Ice Lake提升了5-8%

已知今年10月出的Ice Lake IPC赶上了Zen2,比祖传SKL提升了18%,可惜频率劣势导致性能不如SKL,所以没法上桌面

那随着现在具体频率和IPC都未知的Zen3(明年夏天)和频率未知的Tiger Lake(明年秋天)铺货,后年的CPU市场真的会是一场好戏

CyanCloverFern 发表于 2019-12-25 14:04

本帖最后由 CyanCloverFern 于 2019-12-25 14:06 编辑

albertfu 发表于 2019-12-25 13:59
后来仔细算了算,泄露源IPC说比Ice Lake提升了5-8%

已知今年10月出的Ice Lake IPC赶上了Zen2,比祖传SKL ...
Skylake与zen2同IPC,看SPEC数据。网上各种跑R15来算IPC的不能信,软件太老。真打赢了不至于EPYC出货4%一年在服务器市场。

RPG-7 发表于 2019-12-25 14:06

icelake不咋样啊,同样的25w和14nm的五五开,但频率低,这有啥用

Radeon 发表于 2019-12-25 14:09

albertfu 发表于 2019-12-25 14:11

CyanCloverFern 发表于 2019-12-25 14:04
Skylake与zen2同IPC,看SPEC数据。网上各种跑R15来算IPC的不能信,软件太老。真打赢了不至于EPYC出货4%一 ...

就算是看spec2017,SKL哪来的和zen2同IPC。。。。。。。

服务器市场分析的很多了,2倍于牙膏的perf/watt还只有这点市占率明显不是产品力的问题,而是市场惯性巨大,导致牙膏漏洞频出带来的性能损失,最经济的方案是买更多的漏洞牙膏而不是全部换新

CyanCloverFern 发表于 2019-12-25 14:18

Radeon 发表于 2019-12-25 14:09
你那里看的zen2和skl同IPC的?

你多搜索搜索呗,business的浏览器屏蔽的网站过多没法给你来源。

EraserKing 发表于 2019-12-25 14:22

CyanCloverFern 发表于 2019-12-25 13:59
所以你在笔记本上跑什么耗费算力的应用。8C跑耗费算力的应用功耗在上百w了,笔记本模具有几个能压 ...

8C能上百W?那只能说14nm+++抠脚了……隔壁TDP也就标个65W/95W,还是桌面版……

真的,不要以为一听笔记本要8C就以为是要搞算力比如炼丹什么的
我就告诉你4C下面挂几个后台服务,再编译点东西或者多开几个应用这样的稍微重点的负载,基本上就是全程100%占用,风扇转得隔几个工位都听得见

Radeon 发表于 2019-12-25 14:22

CyanCloverFern 发表于 2019-12-25 14:26

本帖最后由 CyanCloverFern 于 2019-12-25 14:52 编辑

EraserKing 发表于 2019-12-25 14:22
8C能上百W?那只能说14nm+++抠脚了……隔壁TDP也就标个65W/95W,还是桌面版……

真的,不要以为一听笔记 ...
TDP标的能当真就好了或者你跑的不是耗算力的应用。100%占用是调度给了100%, 又不是日常应用,也是你在使用笔记本的缘故, 想风扇转慢的降压。(你看你4C都压不住了,上8C岂不是直接过热关机,重度应用远离笔记本)
供电散热跟不上跑8c可以和mac一样疯狂掉频。

j0n2 发表于 2019-12-25 14:40

EraserKing 发表于 2019-12-25 15:08

CyanCloverFern 发表于 2019-12-25 14:26
TDP标的能当真就好了或者你跑的不是耗算力的应用。100%占用是调度给了100%, 又不是日常应用,也是 ...
笔记本上面怎么不当真了,PL1往往都是跟着TDP走的,TDP大概指代个默频下的功耗也差不了多少,问题是14nm+++下面随随便便功耗就飞天了,TDP虚标在台式机上面大家也就认了,笔记本怎么办,不睿频吧那可怜的频率就还是三秒真男人,睿频吧,功耗爆炸散热也架不住啊
所以早日10nm新架构早日重获新生

至于后半段,什么乱七八糟的,VS编译一跑起来,几个线程并行编译,没几下就掉到1.9G,然后就是肉眼可见的降频卡顿,风扇起飞
至于降压,降压是不可能降压的,这辈子都不可能降压,公司配的傻多戴干活用的机器,又不是我自己的……

CyanCloverFern 发表于 2019-12-25 15:18

EraserKing 发表于 2019-12-25 15:08
笔记本上面怎么不当真了,PL1往往都是跟着TDP走的,TDP大概指代个默频下的功耗也差不了多少,问题是14nm++ ...
傻多戴的本子散热真是一把泪,除了今年的Area系列。。。。。。
跑满100%就算换到10nm也一样风扇起飞。
可以考虑买个静音耳机,编译的时候泡杯茶。

EraserKing 发表于 2019-12-25 15:41

CyanCloverFern 发表于 2019-12-25 15:18
傻多戴的本子散热真是一把泪,除了今年的Area系列。。。。。。
跑满100%就算换到10nm也一样风扇起飞。
可 ...

同样15W TDP,14nm+++ 4C基频1.9,10nm+ICL/TGL下总要比这个强吧,比这还差那就说明牙膏厂早日倒闭好了,别XJB吹了
不能说风扇起飞就是臭狗屎,但是不管是提频也好,加核也好,能减少起飞时段就行

sakuraNTET 发表于 2019-12-25 15:45

7700hq哭晕在厕所,所幸1070还能坚持几年

—— 来自 Xiaomi Mi Note 3, Android 9上的 S1Next-鹅版 v2.2.0.1

CyanCloverFern 发表于 2019-12-25 15:52

EraserKing 发表于 2019-12-25 15:41
同样15W TDP,14nm+++ 4C基频1.9,10nm+ICL/TGL下总要比这个强吧,比这还差那就说明牙膏厂早日倒闭好了, ...

提频加核都会考验风扇的,合理方向是每时钟指令数,提升指令发射宽度深度。

creymorgan 发表于 2019-12-25 15:58

CyanCloverFern 发表于 2019-12-25 15:52
提频加核都会考验风扇的,合理方向是每时钟指令数,提升指令发射宽度深度。 ...

这其实和细分流水线减少每一级流水线内的门电路数是等效的。

EraserKing 发表于 2019-12-25 16:03

CyanCloverFern 发表于 2019-12-25 15:52
提频加核都会考验风扇的,合理方向是每时钟指令数,提升指令发射宽度深度。 ...

可以啊,问题是频率和核心数不能大退步拖后腿,要是像CNL-U那样丢人还是算了

CyanCloverFern 发表于 2019-12-25 16:06

本帖最后由 CyanCloverFern 于 2019-12-25 16:08 编辑

creymorgan 发表于 2019-12-25 15:58
这其实和细分流水线减少每一级流水线内的门电路数是等效的。
流水线级数上去后分支预测出错率惨不忍睹,英特尔犯过一次错之后出了酷睿,AMD然后出了各种农机,到Zen才算回归正轨

Gnyueh 发表于 2019-12-25 16:16

CyanCloverFern 发表于 2019-12-25 16:06
流水线级数上去后分支预测出错率惨不忍睹,英特尔犯过一次错之后出了酷睿,AMD然后出了各种农机,到Zen才 ...

不是分支预测率而是分支预测清空流水线的惩罚,现在intel的CPU流水线级数还是越来越长的,ZEN比intel最长的Sunny cove还长一点

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

CyanCloverFern 发表于 2019-12-25 16:20

Gnyueh 发表于 2019-12-25 16:16
不是分支预测率而是分支预测清空流水线的惩罚,现在intel的CPU流水线级数还是越来越长的,ZEN比intel最长 ...

每多一级流水线,出现分支预测出错的概率越大,表述没问题啊。。。。。。
最长那会流水线已经20多快30了,现在在14左右。

creymorgan 发表于 2019-12-25 17:15

CyanCloverFern 发表于 2019-12-25 16:06
流水线级数上去后分支预测出错率惨不忍睹,英特尔犯过一次错之后出了酷睿,AMD然后出了各种农机,到Zen才 ...

增宽也同样惨的呀。

你瞅啥? 发表于 2019-12-25 17:24

不要吵架 不要吵架 谁说对了最yes的就是它   
扯远了,本人预备2020年底组一台ITX专门看片和日常QQ刷网页做表格,其中看片需要可以硬解4K@60帧 10BIT4:4:4,完全不考虑显卡的情况下 哪家的U合适?(单CPU预算1200以下)

EraserKing 发表于 2019-12-25 17:41

你瞅啥? 发表于 2019-12-25 17:24
不要吵架 不要吵架 谁说对了最yes的就是它   
扯远了,本人预备2020年底组一台ITX专门看片和日常QQ刷网页 ...

2200G都能硬解4K 60 10bit了吧,不过444不知道了
当然只是解,你说有没有余力再挂个madvr加补帧,大概就不行了

Gnyueh 发表于 2019-12-25 17:57

本帖最后由 Gnyueh 于 2019-12-25 18:35 编辑

CyanCloverFern 发表于 2019-12-25 16:20
每多一级流水线,出现分支预测出错的概率越大,表述没问题啊。。。。。。
最长那会流水线已经20多快30了 ...

分支错误率是有分支预测器相关的,和流水线长度没关,分支猜测只在流水线几级有执行,正确率由分支预测器设计决定(这个跟流水线长度没有必然关系),流水线越长,分支错误重填流水线时间越长,Bubble就越多(奔腾四和超频农机这种30多级流水线太烂了不算现代处理器,ZEN的流水线在19左右,uop cache可以把惩罚降低到17(还是15?),SKL的流水线大概在17

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

EraserKing 发表于 2019-12-25 18:12

CyanCloverFern 发表于 2019-12-25 16:20
每多一级流水线,出现分支预测出错的概率越大,表述没问题啊。。。。。。
最长那会流水线已经20多快30了 ...

分支预测出错的代价是清空流水线,流水线越长可以理解成代价越惨重
不要倒果为因了

两个路人 发表于 2019-12-25 18:23

太夏梵天 发表于 2019-12-25 18:32

Gnyueh 发表于 2019-12-25 18:33

太夏梵天 发表于 2019-12-25 18:32
现在APU能插帧吗?7nmAPU据说很香



—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1

EraserKing 发表于 2019-12-25 19:32

两个路人 发表于 2019-12-25 18:23
能解444的只有老黄图灵,然而笔记本电脑上,老黄的卡又不干解码的活

用独显跑播放器就行了吧

Radeon 发表于 2019-12-25 19:35

白头盔 发表于 2019-12-25 19:36

太夏梵天 发表于 2019-12-25 18:32
现在APU能插帧吗?7nmAPU据说很香

插帧用spv专业版,很香了。不比a卡差。用intel集显就行。

EraserKing 发表于 2019-12-25 19:48

Radeon 发表于 2019-12-25 19:35
不能,老黄的移动卡根本屏蔽了视频编解码单元



DXVA原来现在都被开除出硬解行列了?


Radeon 发表于 2019-12-25 20:06

白头盔 发表于 2019-12-25 21:46

mx250确实。。。
好在uhd集显解码强大

CyanCloverFern 发表于 2019-12-26 00:58

本帖最后由 CyanCloverFern 于 2019-12-26 01:03 编辑

EraserKing 发表于 2019-12-25 18:12
分支预测出错的代价是清空流水线,流水线越长可以理解成代价越惨重
不要倒果为因了 ...
代码里那堆连续的ifelse不赞同你的观点。
不是人人都懂用?:来代替ifelse。
流水线长了同时在流水线里塞的分支也多了。一次预测正确率是p,那么总预测率是p^q。

Gnyueh 发表于 2019-12-26 01:25

CyanCloverFern 发表于 2019-12-26 00:58
代码里那堆连续的ifelse不赞同你的观点。
不是人人都懂用?:来代替ifelse。
流水线长了同时在流水线里塞 ...

C的无论是问号还是ifelse在x86汇编里面都会变成条件跳转的,这个没有什么区别,除非某些编译器优化成直接逻辑布尔操作或者avx512那种mask op,不必要大量的分支操作本身就是傻嗨行为,分支密度极低或者分支内指令数量长于流水线长度l的话只考虑分支流水线清空的Bubble就可以了,基本惩罚就是l*p*n(l流水线长度,p分支错误率,n分支次数),如果分支密度很高,在假设极端一点,全部都是分支,这种情况下分支错误惩罚也为p*n*l,这还没有讨论多级分支预测器,以及分支预测器在连续分支下(由于分支短数据基本没有操作),更好的预测效果,以及op cache效果的影响

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.0.1
页: 1 [2] 3
查看完整版本: 移动ZEN2 APU大部分型号了。。。。泄露了,CES 2020见