中国E级别超算系统更多细节曝光，能量效率是目前最大挑战 - 第2页 - ＰＣ数码 - Stage1st

hgfdsa 发表于 2018-12-2 22:26

shiraikuroko 发表于 2018-12-2 22:19
0（1）套啊，epyc一代又没有什么巨大优势，凭啥让人家用了10年的intel跳车？

你觉得epyc2代缺哪点不能 ...

我又没说2代一定不如intel，一直都说的一代远不如

hgfdsa 发表于 2018-12-2 22:27

Radeon 发表于 2018-12-2 22:23
超线程算了，那对EPYC使用intel自家编译器又是什么套路？

linpack这种优化了几十年的代码，随便一个最新的编译器都能跑出接近理论性能的成绩

Radeon 发表于 2018-12-2 22:29

hgfdsa 发表于 2018-12-2 22:32

Radeon 发表于 2018-12-2 22:29
还有就算就当测试条件和配置没有问题。。

双路96核（AVX512）才赢了AMD 64核（AVX128）大概3.4倍，这不 ...

linpack烤鸡大家都是降频跑，如果intel的48核功耗是amd 32
核的2倍，那么iu的性耗比是au的1.7倍，我不觉得intel有什么好丢人的

shiraikuroko 发表于 2018-12-2 22:33

hgfdsa 发表于 2018-12-2 22:36

shiraikuroko 发表于 2018-12-2 22:33
然而amd下代浮点性能提升＞4倍

avx512相对于avx理论浮点提升4倍，结果同功耗能提升2倍就是intel祖坟冒青烟了

Radeon 发表于 2018-12-2 22:37

shiraikuroko 发表于 2018-12-2 22:39

hgfdsa 发表于 2018-12-2 22:40

Radeon 发表于 2018-12-2 22:37
性耗比都出来了。。。你怎么不说intel这个48核能买起码4-5个EPYC 7601了

这个帖子里我比的一直都是能效，如果你非要转移话题，我就不奉陪了

shiraikuroko 发表于 2018-12-2 22:43

hgfdsa 发表于 2018-12-2 22:44

shiraikuroko 发表于 2018-12-2 22:39
epyc2的浮点规格是intel的一半

然而核心多，功耗低，性能/功耗，牙膏再用14nm出来丢人就给秒飞 ...

epyc2 tdp都没有公布，你怎么知道64核和现在的32核功耗一样？

shiraikuroko 发表于 2018-12-2 23:07

hgfdsa 发表于 2018-12-2 23:16

shiraikuroko 发表于 2018-12-2 23:07
EPYC2的TDP没有公布，EPYC2主板公布了啊，MAX TDP=180W没变

那我们赌一盒可乐吧，epyc2的同功耗linpack性能没有epyc的4倍。

shiraikuroko 发表于 2018-12-2 23:30

正义大朋友 发表于 2018-12-3 05:32

auraria 发表于 2018-12-3 06:41

Radeon 发表于 2018-12-2 22:23
超线程算了，那对EPYC使用intel自家编译器又是什么套路？

因为icc能提供最好的性能，这对整个x86来说都成立，即使是对头

Radeon 发表于 2018-12-3 08:30

phorcys02 发表于 2018-12-5 12:00

hgfdsa 发表于 2018-12-2 21:29
超算跑分比linpack，Intel的AVX512能效吊打ryzen，同频4倍的理论性能。不知道amd用上7nm能不能赶上。如果 ...

。。。你真以为跟楼上说的，zen拿来直接做超算么
动点脑...
海光除了国密，好歹还是做了些个超算向SIMD指令的

phorcys02 发表于 2018-12-5 12:02

奶绷子发表于 2018-12-2 21:37
你记错了吧，龙芯从来没做出过超算，好几年前只作出过一个样品，还在天河一之前，没有GPU加速处理器，每 ...

异构超算也是这些年才有的新鲜玩意（虽然学界已经研究很久了）
龙芯3a攒超算时候，老黄的cuda还跑不起呢

twy_2000 发表于 2018-12-11 14:14

本帖最后由 twy_2000 于 2018-12-11 14:15 编辑

奶绷子发表于 2018-12-2 21:37
你记错了吧，龙芯从来没做出过超算，好几年前只作出过一个样品，还在天河一之前，没有GPU加速处理器，每 ...
请搜索曙光6000，这东西刚出来的时候是世界第四。
怎么就成了试验品了？

twy_2000 发表于 2018-12-11 14:16

phorcys02 发表于 2018-12-5 12:02
异构超算也是这些年才有的新鲜玩意（虽然学界已经研究很久了）
龙芯3a攒超算时候，老黄的cuda还跑不起呢 ...

是龙芯3b。

奶绷子 发表于 2018-12-11 18:43

twy_2000 发表于 2018-12-11 19:42

本帖最后由 twy_2000 于 2018-12-11 20:08 编辑

奶绷子发表于 2018-12-11 18:43
主要的计算部件CPU是intel和AMD，GPU是NV的
龙芯用在什么位置没说，只说探索了，“探索了”这个词什么意 ...
为了方便管理和使用，曙光6000超级计算系统高性能计算区分成5个逻辑分区，分别为科学计算分区（GK）、工程计算分区（GG）、生命科学计算（GS）、胖节点分区（Fn）以及龙芯计算分区（Lx）。
　　其中GK、GG、GS分区的每个计算节点由2颗Intel5650六核心处理器组成、主频2.66GHz,配置24GBDDR3内存以及1块Nvidia C2050 GPGPU卡，一块本地2.5 SAS硬盘，一块QDRIB子卡。胖节点分区（Fn）共配臵128台4路A840 SMP计算节点，每个计算节点配臵4颗AMD 6136八核心处理，主频2.4GHz，内存128GB。龙芯分区（Lx）共配臵320台龙芯节点，每个节点配臵1颗AMD64双核CPU和8颗龙芯处理器，20G内存，1块DDRIB网卡。
n卡一张1T算力。龙芯3B一颗128G，塞8颗，一组也差不多1T算力。我估计amd那边也是差不多的。

当然，我不否认龙芯3b是个失败的cpu。

twy_2000 发表于 2018-12-11 19:46

奶绷子发表于 2018-12-11 18:43
主要的计算部件CPU是intel和AMD，GPU是NV的
龙芯用在什么位置没说，只说探索了，“探索了”这个词什么意 ...

纯龙芯的超算也造过。

2007年12月，研制成功集成了336颗64位龙芯2F处理器的中国国产首台万亿次高性能计算机KD-50-I，其理论峰值计算能力达到1.008万亿次。项目由中科大教授陈国良院士主持。该计算机成本控制在80万人民币以下。

奶绷子 发表于 2018-12-11 21:02

奶绷子 发表于 2018-12-11 21:04

页: 1 [2]

Stage1st's Archiver