0(1)套啊 ,epyc一代又没有什么巨大优势,凭啥让人家用了10年的intel跳车?
你觉得epyc2代缺哪点不能 ...
我又没说2代一定不如intel,一直都说的一代远不如 Radeon 发表于 2018-12-2 22:23
超线程算了,那对EPYC使用intel自家编译器又是什么套路?
linpack这种优化了几十年的代码,随便一个最新的编译器都能跑出接近理论性能的成绩 Radeon 发表于 2018-12-2 22:29
还有就算就当测试条件和配置没有问题。。
双路96核(AVX512)才赢了AMD 64核(AVX128)大概3.4倍,这不 ...
linpack烤鸡大家都是降频跑,如果intel的48核功耗是amd 32
核的2倍,那么iu的性耗比是au的1.7倍,我不觉得intel有什么好丢人的 shiraikuroko 发表于 2018-12-2 22:33
然而amd下代浮点性能提升>4倍
avx512相对于avx理论浮点提升4倍,结果同功耗能提升2倍就是intel祖坟冒青烟了 Radeon 发表于 2018-12-2 22:37
性耗比都出来了。。。你怎么不说intel这个48核能买起码4-5个EPYC 7601了
这个帖子里我比的一直都是能效,如果你非要转移话题,我就不奉陪了 shiraikuroko 发表于 2018-12-2 22:39
epyc2的浮点规格是intel的一半
然而核心多,功耗低,性能/功耗,牙膏再用14nm出来丢人就给秒飞 ...
epyc2 tdp都没有公布,你怎么知道64核和现在的32核功耗一样? shiraikuroko 发表于 2018-12-2 23:07
EPYC2的TDP没有公布,EPYC2主板公布了啊,MAX TDP=180W没变
那我们赌一盒可乐吧,epyc2的同功耗linpack性能没有epyc的4倍。 Radeon 发表于 2018-12-2 22:23
超线程算了,那对EPYC使用intel自家编译器又是什么套路?
因为icc能提供最好的性能,这对整个x86来说都成立,即使是对头 hgfdsa 发表于 2018-12-2 21:29
超算跑分比linpack,Intel的AVX512能效吊打ryzen,同频4倍的理论性能。不知道amd用上7nm能不能赶上。如果 ...
。。。你真以为跟楼上说的,zen拿来直接做超算么
动点脑...
海光除了国密,好歹还是做了些个超算向SIMD指令的
奶绷子 发表于 2018-12-2 21:37
你记错了吧,龙芯从来没做出过超算,好几年前只作出过一个样品,还在天河一之前,没有GPU加速处理器,每 ...
异构超算也是这些年才有的新鲜玩意(虽然学界已经研究很久了)
龙芯3a攒超算时候,老黄的cuda还跑不起呢 本帖最后由 twy_2000 于 2018-12-11 14:15 编辑
奶绷子 发表于 2018-12-2 21:37
你记错了吧,龙芯从来没做出过超算,好几年前只作出过一个样品,还在天河一之前,没有GPU加速处理器,每 ...
请搜索曙光6000,这东西刚出来的时候是世界第四。
怎么就成了试验品了?
phorcys02 发表于 2018-12-5 12:02
异构超算也是这些年才有的新鲜玩意(虽然学界已经研究很久了)
龙芯3a攒超算时候,老黄的cuda还跑不起呢 ...
是龙芯3b。 本帖最后由 twy_2000 于 2018-12-11 20:08 编辑
奶绷子 发表于 2018-12-11 18:43
主要的计算部件CPU是intel和AMD,GPU是NV的
龙芯用在什么位置没说,只说探索了,“探索了”这个词什么意 ...
为了方便管理和使用,曙光6000超级计算系统高性能计算区分成5个逻辑分区,分别为科学计算分区(GK)、工程计算分区(GG)、生命科学计算(GS)、胖节点分区(Fn)以及龙芯计算分区(Lx)。
其中GK、GG、GS分区的每个计算节点由2颗Intel5650六核心处理器组成、主频2.66GHz,配置24GBDDR3内存以及1块Nvidia C2050 GPGPU卡,一块本地2.5 SAS硬盘,一块QDRIB子卡。胖节点分区(Fn)共配臵128台4路A840 SMP计算节点,每个计算节点配臵4颗AMD 6136八核心处理,主频2.4GHz,内存128GB。龙芯分区(Lx)共配臵320台龙芯节点,每个节点配臵1颗AMD64双核CPU和8颗龙芯处理器,20G内存,1块DDRIB网卡。
n卡一张1T算力。龙芯3B一颗128G,塞8颗,一组也差不多1T算力。我估计amd那边也是差不多的。
当然,我不否认龙芯3b是个失败的cpu。
奶绷子 发表于 2018-12-11 18:43
主要的计算部件CPU是intel和AMD,GPU是NV的
龙芯用在什么位置没说,只说探索了,“探索了”这个词什么意 ...
纯龙芯的超算也造过。
2007年12月,研制成功集成了336颗64位龙芯2F处理器的中国国产首台万亿次高性能计算机KD-50-I,其理论峰值计算能力达到1.008万亿次。项目由中科大教授陈国良院士主持。该计算机成本控制在80万人民币以下。
页:
1
[2]