hgfdsa 发表于 2018-12-2 22:26

shiraikuroko 发表于 2018-12-2 22:19
0(1)套啊 ,epyc一代又没有什么巨大优势,凭啥让人家用了10年的intel跳车?

你觉得epyc2代缺哪点不能 ...

我又没说2代一定不如intel,一直都说的一代远不如

hgfdsa 发表于 2018-12-2 22:27

Radeon 发表于 2018-12-2 22:23
超线程算了,那对EPYC使用intel自家编译器又是什么套路?



linpack这种优化了几十年的代码,随便一个最新的编译器都能跑出接近理论性能的成绩

Radeon 发表于 2018-12-2 22:29

hgfdsa 发表于 2018-12-2 22:32

Radeon 发表于 2018-12-2 22:29
还有就算就当测试条件和配置没有问题。。

双路96核(AVX512)才赢了AMD 64核(AVX128)大概3.4倍,这不 ...

linpack烤鸡大家都是降频跑,如果intel的48核功耗是amd 32
核的2倍,那么iu的性耗比是au的1.7倍,我不觉得intel有什么好丢人的

shiraikuroko 发表于 2018-12-2 22:33

hgfdsa 发表于 2018-12-2 22:36

shiraikuroko 发表于 2018-12-2 22:33
然而amd下代浮点性能提升>4倍

avx512相对于avx理论浮点提升4倍,结果同功耗能提升2倍就是intel祖坟冒青烟了

Radeon 发表于 2018-12-2 22:37

shiraikuroko 发表于 2018-12-2 22:39

hgfdsa 发表于 2018-12-2 22:40

Radeon 发表于 2018-12-2 22:37
性耗比都出来了。。。你怎么不说intel这个48核能买起码4-5个EPYC 7601了

这个帖子里我比的一直都是能效,如果你非要转移话题,我就不奉陪了

shiraikuroko 发表于 2018-12-2 22:43

hgfdsa 发表于 2018-12-2 22:44

shiraikuroko 发表于 2018-12-2 22:39
epyc2的浮点规格是intel的一半

然而核心多,功耗低,性能/功耗,牙膏再用14nm出来丢人就给秒飞 ...

epyc2 tdp都没有公布,你怎么知道64核和现在的32核功耗一样?

shiraikuroko 发表于 2018-12-2 23:07

hgfdsa 发表于 2018-12-2 23:16

shiraikuroko 发表于 2018-12-2 23:07
EPYC2的TDP没有公布,EPYC2主板公布了啊,MAX TDP=180W没变

那我们赌一盒可乐吧,epyc2的同功耗linpack性能没有epyc的4倍。

shiraikuroko 发表于 2018-12-2 23:30

正义大朋友 发表于 2018-12-3 05:32

auraria 发表于 2018-12-3 06:41

Radeon 发表于 2018-12-2 22:23
超线程算了,那对EPYC使用intel自家编译器又是什么套路?

因为icc能提供最好的性能,这对整个x86来说都成立,即使是对头

Radeon 发表于 2018-12-3 08:30

phorcys02 发表于 2018-12-5 12:00

hgfdsa 发表于 2018-12-2 21:29
超算跑分比linpack,Intel的AVX512能效吊打ryzen,同频4倍的理论性能。不知道amd用上7nm能不能赶上。如果 ...

。。。你真以为跟楼上说的,zen拿来直接做超算么
动点脑...
海光除了国密,好歹还是做了些个超算向SIMD指令的

phorcys02 发表于 2018-12-5 12:02

奶绷子 发表于 2018-12-2 21:37
你记错了吧,龙芯从来没做出过超算,好几年前只作出过一个样品,还在天河一之前,没有GPU加速处理器,每 ...

异构超算也是这些年才有的新鲜玩意(虽然学界已经研究很久了)
龙芯3a攒超算时候,老黄的cuda还跑不起呢

twy_2000 发表于 2018-12-11 14:14

本帖最后由 twy_2000 于 2018-12-11 14:15 编辑

奶绷子 发表于 2018-12-2 21:37
你记错了吧,龙芯从来没做出过超算,好几年前只作出过一个样品,还在天河一之前,没有GPU加速处理器,每 ...
请搜索曙光6000,这东西刚出来的时候是世界第四。
怎么就成了试验品了?

twy_2000 发表于 2018-12-11 14:16

phorcys02 发表于 2018-12-5 12:02
异构超算也是这些年才有的新鲜玩意(虽然学界已经研究很久了)
龙芯3a攒超算时候,老黄的cuda还跑不起呢 ...

是龙芯3b。

奶绷子 发表于 2018-12-11 18:43

twy_2000 发表于 2018-12-11 19:42

本帖最后由 twy_2000 于 2018-12-11 20:08 编辑

奶绷子 发表于 2018-12-11 18:43
主要的计算部件CPU是intel和AMD,GPU是NV的
龙芯用在什么位置没说,只说探索了,“探索了”这个词什么意 ...
为了方便管理和使用,曙光6000超级计算系统高性能计算区分成5个逻辑分区,分别为科学计算分区(GK)、工程计算分区(GG)、生命科学计算(GS)、胖节点分区(Fn)以及龙芯计算分区(Lx)。
  其中GK、GG、GS分区的每个计算节点由2颗Intel5650六核心处理器组成、主频2.66GHz,配置24GBDDR3内存以及1块Nvidia C2050 GPGPU卡,一块本地2.5 SAS硬盘,一块QDRIB子卡。胖节点分区(Fn)共配臵128台4路A840 SMP计算节点,每个计算节点配臵4颗AMD 6136八核心处理,主频2.4GHz,内存128GB。龙芯分区(Lx)共配臵320台龙芯节点,每个节点配臵1颗AMD64双核CPU和8颗龙芯处理器,20G内存,1块DDRIB网卡。
n卡一张1T算力。龙芯3B一颗128G,塞8颗,一组也差不多1T算力。我估计amd那边也是差不多的。

当然,我不否认龙芯3b是个失败的cpu。

twy_2000 发表于 2018-12-11 19:46

奶绷子 发表于 2018-12-11 18:43
主要的计算部件CPU是intel和AMD,GPU是NV的
龙芯用在什么位置没说,只说探索了,“探索了”这个词什么意 ...

纯龙芯的超算也造过。

2007年12月,研制成功集成了336颗64位龙芯2F处理器的中国国产首台万亿次高性能计算机KD-50-I,其理论峰值计算能力达到1.008万亿次。项目由中科大教授陈国良院士主持。该计算机成本控制在80万人民币以下。

奶绷子 发表于 2018-12-11 21:02

奶绷子 发表于 2018-12-11 21:04

页: 1 [2]
查看完整版本: 中国E级别超算系统更多细节曝光,能量效率是目前最大挑战