找回密码
 立即注册
搜索
查看: 6706|回复: 63

[硬件] AMD公布微软定制的Ryzen Microsoft Surface Edition性能(对比 1065G7

[复制链接]
头像被屏蔽
     
发表于 2019-10-2 23:46 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-2 23:49 | 显示全部楼层
还是Vega,辣你定制个🔨
回复

使用道具 举报

头像被屏蔽
     
发表于 2019-10-2 23:56 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-2 23:58 | 显示全部楼层
这就是完整版的ZEN+ APU for mobile吧,不过ZEN+ CPU性能还是不够看,内存估计还是2400MHz,浮点跟AVX512护体的icelake就别比了,整数性能也落下一大截 (ICL>>ZEN 2>SKL>>ZEN(+))
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2019-10-3 00:01 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-3 00:14 | 显示全部楼层
gpu性能超过2200g了啊
回复

使用道具 举报

     
发表于 2019-10-3 00:17 | 显示全部楼层
低压zen+这种渣渣卖高价,微软可以的
回复

使用道具 举报

     
发表于 2019-10-3 00:33 | 显示全部楼层
Radeon 发表于 2019-10-3 00:01
笔记本跑AVX512是疯了吧。。。

同样功率限制跑浮点,你AVX2拆半跑也是跑,AVX512跑也是跑,降频降到1.8也比你ZEN + 3.0 拆半跑跑得快,AVX512能效比摆在哪里,拿发热糊谁呢,,,再说了这还是10nm的,高频上不去低频跟GF12nm拼拼能耗还是绰绰有🐟的
回复

使用道具 举报

     
发表于 2019-10-3 00:34 | 显示全部楼层
BallanceHZ 发表于 2019-10-3 00:17
低压zen+这种渣渣卖高价,微软可以的

独一无二的完整版mobile APU买个纪念价(
回复

使用道具 举报

     
发表于 2019-10-3 00:35 来自手机 | 显示全部楼层
Gnyueh 发表于 2019-10-3 00:33
同样功率限制跑浮点,你AVX2拆半跑也是跑,AVX512跑也是跑,降频降到1.8也比你ZEN + 3.0 拆半跑跑得快,A ...

记得anandtech测icelake 跑avx512只有1.1Ghz…

—— 来自 HUAWEI EVR-AL00, Android 9上的 S1Next-鹅版 v2.1.2
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2019-10-3 00:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-3 00:40 | 显示全部楼层
startraveller 发表于 2019-10-3 00:35
记得anandtech测icelake 跑avx512只有1.1Ghz…

—— 来自 HUAWEI EVR-AL00, Android 9上的 S1Next-鹅版  ...

来源链接球球(没翻到),我自己测dell 7390本 Y-cruncher速度大概在1.8G左右的(25W),比我去年给父亲推荐的2500U本快很多,,,
回复

使用道具 举报

     
发表于 2019-10-3 00:45 | 显示全部楼层
Radeon 发表于 2019-10-3 00:37
你知道1065G7跑AVX512频率和功耗多少吗?

我现在用的就是,转总你给我来个3500U Y-cruncher跑分,我现场给你来个1065G7 (插电cTDP 25W) Y-cruncher跑分好吗
回复

使用道具 举报

头像被屏蔽
     
 楼主| 发表于 2019-10-3 00:57 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-3 01:06 | 显示全部楼层
Radeon 发表于 2019-10-3 00:57
和只有128bit位宽AVX的zen+比有什么好比的

和同样15w的intel比比看?

您转进也太快了,,,我准备都摆好测试结果了您给我转进如风14nm+++
先说结果,15W性能对比整数和渲染来看,comet和ice性能持平,频率略低,部分原因由于ice把雷电什么的都集成进叻CPU,导致同样TDP下IA Cores分得的功率更为不足,也由于sunny cove核心规模更大但是10nm打磨不算到位,浮点AVX512摆在哪里,不多谈!
回复

使用道具 举报

     
发表于 2019-10-3 01:10 | 显示全部楼层
Gnyueh 发表于 2019-10-3 00:45
我现在用的就是,转总你给我来个3500U Y-cruncher跑分,我现场给你来个1065G7 (插电cTDP 25W) Y-crunche ...

转总点的一份测试结果,可是刚准备上菜却不要了
TIM图片20191003005901.jpg
测试中
[url=] TIM图片20191003005852.jpg [/url]

测试结果
回复

使用道具 举报

     
发表于 2019-10-3 01:12 | 显示全部楼层
Radeon 发表于 2019-10-3 00:57
和只有128bit位宽AVX的zen+比有什么好比的

和同样15w的intel比比看?

相关结果您去知乎找火鸡测试贴吧,我先睡力
回复

使用道具 举报

头像被屏蔽
     
发表于 2019-10-3 13:39 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-3 19:46 来自手机 | 显示全部楼层
sblnrrk 发表于 2019-10-3 13:39
你那是AVX512占比100%的程序 ,事实上没有傻逼在笔记本上用这种

别说AVX512了,就是AVX2提升超过20%的都 ...

ICELAKE没有AVX512 OFFSET,不是纯512程序也不会固定降频到固定1.8,不会影响程序中混合的整数计算效率,,,至于AVX512效率,你不会写不代表没有人会优化,不会优化也有MKL这种现成的库可以用。
ZEN+ APU那个水平还是歇着吧,跑分遍地都是,整数打不过,浮点更别说了,日常应用测试一直是INTEL领先。

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.0.2-play
回复

使用道具 举报

头像被屏蔽
     
发表于 2019-10-3 23:19 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-4 01:21 来自手机 | 显示全部楼层
sblnrrk 发表于 2019-10-3 23:19
你倒是告诉我,哪个生产力工具,avx512真有翻倍提升的?

没 固定offset不代表不降频,笔记本上固定offse ...

本人用的MATLAB,矩阵计算都是调用mkl,至于提升多少倍,您去看mkl的reference document吧,不多谈!
AVX512能耗比摆在那里,发射一条AVX512指令能完成的事,你APU得发射两条AVX2指令附加拆分128bit半速计算,究竟是谁的功耗更大。
按您的理论,AVX512速度是不是应该比3700U x87 fp跑的还慢,Y-cruncher 结果之前我已经po出来了,欢迎您完成转总未竟的工作。

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.0.2-play
回复

使用道具 举报

     
发表于 2019-10-4 01:26 来自手机 | 显示全部楼层
sblnrrk 发表于 2019-10-3 23:19
你倒是告诉我,哪个生产力工具,avx512真有翻倍提升的?

没 固定offset不代表不降频,笔记本上固定offse ...

没固定OFFSET而且低浮点负载本身发热就不会很严重也不会降频影响其中混合的整数运算,高浮点负载offset也比你满频跑AVX2半速来的要快,功耗相同AVX512能耗比摆在那里,当然您非得拿垃圾代码说事我也没办法。

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.0.2-play
回复

使用道具 举报

     
发表于 2019-10-4 01:46 来自手机 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-4 02:09 编辑

AVX512效率对比,注意本身icl u的512就是1*fma的,效率比同宽度,理论吞吐相同的AVX2 2* fma的其他同频高一些,至于对比APU的128*2,您和同浮点吞吐水平的Ivy Bridge比比就行了,不多谈!

http://www.numberworld.org/y-cruncher/

—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.0.2-play
回复

使用道具 举报

     
发表于 2019-10-5 22:18 | 显示全部楼层
Gnyueh 发表于 2019-10-3 00:40
来源链接球球(没翻到),我自己测dell 7390本 Y-cruncher速度大概在1.8G左右的(25W),比我去年给父亲 ...

https://www.anandtech.com/show/1 ... tel-ice-lake-10nm/5

Second to note is the AVX-512 frequency. Not listed here, but under the 15W mode we saw the AVX-512 frequency around 1.0-1.1 GHz, while at 25W it was around 1.4-1.5 GHz. That’s quite a drop from non AVX-512 code, for sure.
回复

使用道具 举报

头像被屏蔽
     
发表于 2019-10-6 12:53 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-6 13:15 来自手机 | 显示全部楼层
笔记本avx512……

—— 来自 vivo NEX S, Android 9上的 S1Next-鹅版 v2.1.0-play
回复

使用道具 举报

     
发表于 2019-10-6 14:20 | 显示全部楼层
现在培训材料是开始下发AVX512成绩了吗?GT430跑飞贼克死7970是吧
回复

使用道具 举报

     
发表于 2019-10-6 20:19 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-6 21:05 编辑
sblnrrk 发表于 2019-10-6 12:53
吹了半天也就跑个95秒很快么?Y-CRUNCHER跑的是理论性能,你倒是来个实测场景翻倍的出来看看? ...

Y-cruncher不是实测场景吗吗,跑理论性能直接用AIDA64算了,也免得人家作者一遍遍优化代码叻,以及您还没有把3500U的成绩端上来 捕获.PNG
回复

使用道具 举报

     
发表于 2019-10-6 20:26 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-6 21:06 编辑
KOGmk2 发表于 2019-10-6 14:20
现在培训材料是开始下发AVX512成绩了吗?GT430跑飞贼克死7970是吧

本废物吹的是IPC,其次才是吞吐,ZEN+ APU性能和ZEN2以及Icelake比起来确实不够看(酥麻的APU慢半拍政策为人诟病也不是这一回了,下一代Renior也是ZEN 2+Vega没得Navi)当性价比产品还可以,但是支撑不起来surface这么高的溢价,我寻思我在我在本坛吹了半年的ZEN 2,才吹了一下Ice Lake怎么就有小将往身上扣屎盆子呢。
另外对于Y_cruncher,h.265(x265 encoder, GPU HW或者CUDA转码细节损失在压制组里面都是些老生成谈的话题了)这种依靠字节操作且大量分支的运算您可以试试拿GPU跑是什么水平,GPU能发挥出理论运算的多少水平
回复

使用道具 举报

     
发表于 2019-10-6 20:48 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-6 21:06 编辑
你的全家 发表于 2019-10-6 13:15
笔记本avx512……

—— 来自 vivo NEX S, Android 9上的 S1Next-鹅版 v2.1.0-play


笔记本功耗有限不更应该用high-efficiency instruction set吗
回复

使用道具 举报

     
发表于 2019-10-6 21:26 | 显示全部楼层
sblnrrk 发表于 2019-10-6 12:53
吹了半天也就跑个95秒很快么?Y-CRUNCHER跑的是理论性能,你倒是来个实测场景翻倍的出来看看? ...

鉴于您一直未能正面回应与icelake对比的ZEN+ APU性能,本人只能替您寻找一点论据
HWBOT上2700U 3700U 3500U的测试成绩皆缺如,仅有2500U的成绩,但是考虑到ZEN+ ZEN架构并没有很大的改进,最重要的是FPU(SIMD)没有拓宽,所以可以认为2500U成绩可以代表ZEN+ APU的性能且差距不会大于主频差距(因为功耗限制原因,实际会更小)
https://hwbot.org/submission/395 ... 0u_4min_13sec_503ms
结果253秒,仅优于AVX ISA支持,3.2GHz的Core i7 3630QM,由于半吞吐远落后于SKL架构的全吞吐移动CPU,在此基础上更落后于效率更高支持AVX512的ICL,CNL CPU
回复

使用道具 举报

     
发表于 2019-10-6 21:30 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-7 11:03 编辑

谢谢茄子,,,估计是Y-cruncher负载比较复杂,里面混合了不少逻辑运算,和单纯的FPU压力测试实际差距更大吧,我今天又测试了一下,25W Y-cruncher实际频率HWiNFO显示在2.2G左右,而任务管理器显示的则是1.8GHz
回复

使用道具 举报

     
发表于 2019-10-6 23:43 | 显示全部楼层
Gnyueh 发表于 2019-10-6 21:30
谢谢茄子,,,估计是Y-cruncher负载比较复杂,里面混合了不少逻辑运算,和单纯的FPU压力测试实际差距更 ...

虽然我没有icelake,但是以我的7820X实际使用体验看来。。有些应用,例如x265,如果默频(140W TDP)基本上AVX512和AVX2区别不是很大,因为默频8核,AVX2全核大概3.6Ghz,AVX512大概3Ghz,频率差打消了20%左右的增益。解锁功耗好一点了(x265 全核4.2Ghz AVX512直接破210W,再高我猫头鹰D15散热扛不住,AVX2可以跑4.5Ghz)。

实际应用场景除了工作用Gromacs什么的,基本上很少有提升超过20%-30%这个量级的,AVX512提升的高的一般都是可并行化比较强的应用,那种应用一般用CUDA快多了。

感觉笔记本上那十几二十w的功耗,不太应该对AVX512有太高期待。。

评分

参与人数 1战斗力 +1 收起 理由
Gnyueh + 1 好评加鹅

查看全部评分

回复

使用道具 举报

头像被屏蔽
     
发表于 2019-10-7 03:29 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2019-10-7 05:05 | 显示全部楼层
只比牙膏G7好了4%,vega迫真高能低效,13寸性价比爆棚
回复

使用道具 举报

     
发表于 2019-10-7 09:48 | 显示全部楼层
JWJking 发表于 2019-10-7 05:05
只比牙膏G7好了4%,vega迫真高能低效,13寸性价比爆棚

毕竟这俩隔了整整两代
而且LPDDR4x-3733 vs LPDDR4-2400,带宽差得有点多
回复

使用道具 举报

     
发表于 2019-10-7 10:09 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-7 11:33 编辑
sblnrrk 发表于 2019-10-7 03:29
icl比apu赢了很牛比么?比起intel自家或者是zen2,移动端512几乎没有增益,avx2到顶了

avx512拿cpu跑等 ...

1.“icl比apu赢了很牛比么?”:在本场景下ICL-U对比的就是ZEN+系列APU,考虑两者都有搭载的同Surface移动平台下性能表现。且surface APU版本售价高于ICL-U版,可以认为其为对位同档次产品,且APU在MS眼中,由售价可知,更为高端一些,所以将这两者对比并无不合理之处。

2."比起intel自家或者是zen2" (1):ZEN 2架构目前没有移动端平台,无法对比,而SKL平台(Whiskeylake平台,上次回复中截图也可见)的测试结果在上述官方网站连接中已经给出,欢迎自行对比,故不赘述。


3."移动端512几乎没有增益,avx2到顶了":关于您对AVX512性能提升理解的错误,我已说移动端的AVX512是半吞吐的,SIMD FMA宽度是512bit,和SKL、ZEN2 CPU一致,为ZEN(+)CPU(256bit)的两倍,而非intel服务器CPU的全吞吐AVX512(1024bit),只不过支持AVX512指令集可以更高效的运行,也就是说上面发的那个表里面对比的除了3930QM之外,其吞吐提升(110s->85s)都来源于新的指令集而非吞吐规模,且注意到1065G7的功耗限制只有25W远低于其他移动U。

4."比起intel自家或者是zen2" (2):关于ZEN 2桌面平台下Y-cruncher性能对比,鉴于现在Y-cruncher还没有专门为ZEN2优化的binary,上述链接中已经提供了基于ZEN1 binary的测试结果,可见由于测试主频、binary优化以及测试用内存不同灯原因,ZEN 2性能表现仍弱于9900K,但是已经基本在一个水平线上,可以认为IPC大致相同,考虑到上述移动端测试结果(AVX2 vs AVX512),在架构层面上可以认为ZEN 2仍弱于ICL,但已经达到较为正常的表现水平。
关于ZEN 2、 SKL、 ICL的整数、浮点IPC测试结果可以参照如下链接https://www.anandtech.com/show/14664/testing-intel-ice-lake-10nm/4

5.“avx512拿cpu跑等于轿车比拉货,神经病啊,不用卡车买个皮卡也秒杀你”:同CPU不同指令集支持binary下的性能测试测试结果如下:
捕获.PNG
可见新指令集带来的性能提升并不会因为其“缺点”(如果效率高可以认为是缺点的话)而掩盖,您所谓的“卡车和皮卡”也没有比所谓的“轿车”快.

6.关于实际负载和理论性能问题:我仍然认为像Y-cruncher这样的具有实际意义(计算pi值)的运算可以视作实际负载,而理论性能则是单纯使得FPU的负载达到最大的运算(例如AIDA 64 Stress FPU),而且从我前述测试结果来看,Y-cruncher在运行时并没有降频到单纯Stress FPU一样的频率,可见其混合了大量的逻辑整数运算,并非理论最大负载。关于这个到底算不算实际负载的讨论,您可以参见:https://www.chiphell.com/forum.p ... rtype=1&tid=2005766
相比于您脑中的AVX512,过热、慢等印象,Y-cruncher作为具有实际意义的负载,其高性能是通过作者的长期精心优化、绕开缓存瓶颈、同时紧跟最近指令集拓展得到的,可以视为达到了AVX512较为理想的效率。

如果认为您这个测试不具备实际意义,您可以贴出您认为具有实际意义的测试,以佐证您的观点。



您在这里什么都没看懂就大放厥词,实在令人感到遗憾。

还望您在下次评论的时候摆上一些相应的事实论据,方便讨论的继续,不然我将很难对您的观点进行回复。
回复

使用道具 举报

     
发表于 2019-10-7 10:12 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-7 11:11 编辑
yukika 发表于 2019-10-7 09:48
毕竟这俩隔了整整两代
而且LPDDR4x-3733 vs LPDDR4-2400,带宽差得有点多

下一代APU Renior 就是ZEN 2+ vega 15 + LPDDR4 4266了,虽然没有Navi(更新的缓存设计,对带宽依赖更小),但是LPDDR4 4266估计能够缓解Vega性能受带宽限制的问题
回复

使用道具 举报

     
发表于 2019-10-7 10:15 | 显示全部楼层
JWJking 发表于 2019-10-7 05:05
只比牙膏G7好了4%,vega迫真高能低效,13寸性价比爆棚

ZEN+ APU实在支撑不起这么高的溢价(即使是打了个田牌标志的定制版
回复

使用道具 举报

     
发表于 2019-10-7 11:02 | 显示全部楼层
本帖最后由 Gnyueh 于 2019-10-7 11:11 编辑
startraveller 发表于 2019-10-6 23:43
虽然我没有icelake,但是以我的7820X实际使用体验看来。。有些应用,例如x265,如果默频(140W TDP)基本 ...

ICL-U的AVX512相比于SKL-X的AVX512,首先是吞吐方面的差别,其次是AVX512指令集子集支持方面的,ICL-U的AVX-512支持仅有半吞吐(1 * 512bit FMA),和SKL移动CPU一致,所以不会有SKL-X平台上 2 * 512bit FMA吞吐过高导致发热的情况,但是支持新的AVX512指令集子集可以达成更高的运行效率,在同功耗下取得更合理的性能。
关于AVX512的性能瓶颈问题,牙膏似乎也觉察到了,对于512bit这样的大宽度浮点操作,对于CPU缓存、内存性能都有很大的负担(https://www.chiphell.com/forum.p ... rtype=1&tid=2005766),容易形成瓶颈,此外也很难达到精细化的操作。前者牙膏在SKL-X上面引入Mesh总线,提升缓存性能,虽然并不算理想,对于后者牙膏也引入了诸多AVX512子集,改善操作精细度和预取性能,不过这也反面导致了AVX512支持子集的破碎化,增加了支持难度……
对于过热问题,本身的缘由我感觉主要在于牙膏在14nm卡的太久了,需要新的制程来支撑更大规模的SIMD抑制发热……
同样是由于AVX512子集和代码优化问题,x265在AVX512下的性能表现,通过支援新的子集仍然有改进提升效率的空间。现在的x265支援指令集版本,考虑到其发行日期应该不会高于AVX512-DQ。通过更新和改进缓存预取应该能进一步有所提升。
AVX指令优化困难难以提高效率不算是新的话题了,Y-cruncher作者本人也提到过http://www.numberworld.org/y-cruncher/news/2017.html,但是通过Y-cruncher这两年的迭代性能提升来看,像x265这样的算法其仍有很大的优化空间。
对于比较GPU并行运算,确实GPU的吞吐远高于CPU(即使支持了AVX512 拓宽SIMD之后),但我感觉AVX512对于某些双精度运算或者分支较多的运算,仍有不少意义。

谨受教。
(吹了半天本来想吹IPC的,结果被转总带到AVX512这个争议话题上掉沟里了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-11-16 02:31 , Processed in 0.130249 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表