找回密码
 立即注册
搜索
查看: 6951|回复: 45

[硬件] 后14nm时代--含泪打下去顺便数钱的时代

[复制链接]
     
发表于 2021-2-17 22:28 | 显示全部楼层 |阅读模式
https://weibo.com/ttarticle/p/show?id=2309404605279491981938
​​5年前,随便胡诌了关于14nm的文章,之后我始终是14nm至上主义,包括现在都是,理由很简单啊,成年人的世界,不仅关注参数,还要关注更多的东西,到了2021年,连**都只预见到2020年的14nm确实走到了高性能的终局,Rocket Lake终究会成为历史,Power9也是要终结的,之后大概只有AMD还坚持14nm这个节点了吧(EPYC的IOD千秋万代是更经济的选择)。
半导体圈子在迈向物理极限的方向上已经进入深水区:
​AMD的图,无视良品率的前提下250平方毫米芯片的成本演化,从HKMG时代开始计算(45nm),一直到14nm时代成本翻番,前后经历了8年时间,但是14nm到5nm,仅仅4年时间,成本从2X翻到了5X。胡诌一下就是AMD在2017年的zen1内核同等大小的核心,不考虑良品率的前提下,到了7nm时代成本翻了1.8倍,5nm时代成本翻了2.5倍,那么收益呢?
我们用巨硬的XBOX家族演化来说明下:
7nm时代,集成度提升跑赢了成本提升,所以Project Scarlett仍然可以为巨硬所接受。
性能方面鉴于大家都是买GPU送CPU,直接看GPU部分比较直观。
图形性能2X,这就是答案,仍然勉强跑赢了成本增幅。
但是额外代价呢?15% TDP增幅
为了控制噪音水平不变,温度依然巨高
另一个代价,高性能工艺越来越不容易,设计目标12TF性能,28WGP 只需要跑出 1.675ghz,26WGP 就必须抛出1.825G,代价是20%的功耗增幅,这就是接近n7的拐点的信号,但不得不这么做,因为巨硬考虑到的是良品率,宁可增加点TDP,也要向良品率妥协,否则性能收益恐怕跑不赢成本。
即使是一天到晚发明工艺的TSMC,在此时也承认成本已经成为巨大的问题,需要在硬件设计上就有充分考虑。
这是7nm发生的事,2020年,TSMC 7nm已经属于成熟工艺(至少在TSMC自己的宣传中)。
那么发明的5nm时代的博弈就更为艰难了。

所以,先进封装在成本控制越来越困难的10nm节点上(或者发明的7nm,5nm)会成为成本控制的杀手锏,无他,5nm太贵了,拿来塞IO巨亏无比。
​AMD在ROME、ZEN2上就开始实施I/O与计算部分的分离也是出于这一目的,盘子小,能省钱的套路,AMD一般会更早的去尝试,而intel则更喜欢等技术储备完善后再下手,所以zen2连L3都没完全打通,就开启了分离设计,intel则因为DARPA的项目,拿用户做了回EMIB的小白鼠,各有各的玩法,等到今年下半年的产品上给你们看真功夫。


这也带来了一个有意思的话题,就是先进工艺的市场需求也许以后没有想象中那么大,毕竟HPC中I/O以外才需要,桌面处理器以后全面独立I/O的可能也会越来越大。
所以先进工艺节点上,手机SOC相关的比重仍然没有打破原来的格局,HPC在I/O独立后,先进工艺使用的成分反而会有所降低。
今年5nm节点出货预期,该预期基于老黄GH100如期而至,AMD的ZEN4和新一代CDNA RDNA如期而至,挖矿等的份额相当于A/N总和,如果A/N不能如期而至,5nm依旧是面积控的天下,所以少了菊花对TSMC而言是巨大的损失。

今年7nm节点出货的预期,AMD包括了PS5和XBOX SX,intel的7%正好填补菊花的空缺,7nm无疑是今年高性能的重要节点。

成本是一方面,性能需要更多的努力。

性能是如何提升的?
IPC是性能的一部分,强调IPC恰恰暴露了工艺的极限已到。
我之前面对那些只听过移动处理器的人,提过一个问题,工艺的性能到底看什么,厂商不公开的,确切的说2006年后就没人公开了,因为再也没法提升了。
跑一个测试就能明白为什么都要吹IPC而不是工艺的性能:
​L1延迟 1ns,这个数字我在2007年购买的E6850默认就超越了这个boost成绩,因为E6850的L1延迟是3个时钟周期,从nehalem开始变为4个时钟周期,所以如果boost不到4G以上,L1延迟连1ns都无法击穿。酷睿2时代,4G是能达到的超频频率,此时的L1延迟,比10代CML跑在 5.3G的时候更好。
很多事情并不是巧合,从nehalem开始,intel的桌面处理器的L1延迟就一直是4个时钟周期,所以超不到 5G实际对半导体性能的榨取还不如2006年。
更恐怖的是L2延迟,酷睿2的4MB L2延迟为10个时钟周期,跑在4G下的时候L2延迟为2.5ns,何况这货的L2还负责系统互连,有高速交换开关,在2006年堪称奇迹,真正的砸大本钱摁死AMD。而在core时代,整整10代core都是把原来的L2拆成了L2和L3,L3还变成了ring bus或者mesh,怂了就是怂了。
我在底下这篇文章中讲了本钱有多大。


无节操的DrBT
10月28日21:38 来自 微博 weibo.com
发布了头条文章:《从2006谈起--你们知道我要说的是INTC》  O网页链接









由此可见,晶体管性能冲高回落的过程已经整整经历了13年,你不知道不代表这事情没有发生。
到了intel的cove内核时代,L1延迟变为5,所以,5Ghz的cove,L1延迟还不如3Ghz的酷睿2和苹果M1,与4Ghz的skylake等同。

5nm时代,苹果M1处理器被吹上了天,对,吹上天的,理由其实是很简单的,这是一个专用意味很强的处理器,无需考虑任何软件兼容问题和复杂应用问题,苹果可以的话甚至可以做点ASIC带你们飞。L1延迟3个时钟周期,不再跑高,巨大的乱序执行窗口,超宽的前后端,一切为低频工作的高性能设计。
​L1延迟和超宽设计的结果就是,低频下无人能敌,这并不是新生事物。
​恪守1ns延迟的底线不突破。
​事实上移动处理器3个时钟周期延迟是标配,大家都也恪守1ns底线,只不过苹果的超宽设计别家还做不到。
​即使是intel,ATOM系列也为低频工作设计,L1延迟尽量做低,值得注意的是tremont开始ATOM也有咬人的趋势,逐渐变宽的设计使得Tremont已经在那些轻量级测试中获得了与同频Haswell一战的资本。Tremont的boost可以到3.3G,全核3G,居然小小的击穿了1ns,10W TDP 4核,intel拉胯的10nm+可能只是相对于自家14nm而言的。
​轻量级测试R20的单线成绩,Tremont内核的Jasper Lake Pentium Silver N6005,单线boost频率3.3Ghz,R20单线到294,跟同频HSW有的一打,甚至压倒了R5 4650U,所以并不只有M1在咬桌面处理器,ATOM同样在咬人,今年ATOM内核进化到Gracemont,支持AVX2,单线也继续大幅推进,SKL级别的IPC配合低延迟L1你怕不怕。

所以,性能不再提高(甚至大体是下降的)的前提下,业界转向更复杂的设计是必由之路,累死硬件工程师再说。

新形势
高性能工艺为什么突然吃紧了?
结合成本与性能两点可以得出,高性能工艺对代工厂来说重视程度在下降,反正新工艺只有手机soc厂商用,何必指望高性能呢?又不赚钱对吧,满足苹果的要求就可以活的好好的。
AMD你要早用N7么,现成的只有手机SOC改,凑合着用,要么帮我们调试N7P?
于是很早我就发现zen2用的是低功耗版的库,直到zen3才转为高性能库:
图为AMD发布于ISSCC2020的吹逼文

0.7v 1.8G,0.8V 2.4G,0.9V 3.9G,对比1.1V从1.6G管到3.9G的zen2内核,这就是高性能和低功耗的典型差异。
​所以TSMC的N7P,大致可以认为是老黄为了GA100不那么难看,点了一下才变得可用,由于N7P精贵,大家扎堆的2020年Q4,就只能一起缺货了。
这类问题厂商都是为了利润正常的操作,仅此而已,现在显卡已经成为PC中最贵的产品,跟先进工艺的成本有直接关系,所以不要一面吹新工艺的好,一面骂显卡贵,这叫精分。


回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-17 22:57 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-17 23:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-17 23:27 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-17 23:31 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2021-2-17 23:46 | 显示全部楼层
本帖最后由 kuleisite1992 于 2021-2-17 23:48 编辑

不能这么比吧,5nm工艺下的晶体管和45nm工艺下的晶体管可以说是两种完全不同的玩意
隔壁闲着蛋疼建模测试晶体管的杨氏模量,基本上是差了4-5个倍

这也许是新工艺下的CPU无论IA都容易到手坏的原因之一吧
回复

使用道具 举报

     
发表于 2021-2-17 23:59 | 显示全部楼层
最近怎么很多文章搞得m1全靠专用加速模块一样,m1你扔了那群硬件加速模块也很强好吧
回复

使用道具 举报

发表于 2021-2-17 23:59 | 显示全部楼层
以后先进制程都会优先在手机上,电脑芯片差距会越来越大。
回复

使用道具 举报

     
发表于 2021-2-18 10:02 | 显示全部楼层
好像有人乐观估计我国2025年能国产14nm?按楼主的说法岂不是前途一片光明
回复

使用道具 举报

     
发表于 2021-2-18 10:27 | 显示全部楼层
都怪Intel,要是他的10nm,7nm不翻车,业界会是现在这个样子?
回复

使用道具 举报

     
发表于 2021-2-18 10:45 | 显示全部楼层
新工艺现在也越来越难搞了,三星的5nm翻车的很彻底,台积电的5nm其实也不如ppt。半导体也很可能在未来三十年间出现弯道超车技术,因为感觉目前的赛道差不多快到头了
回复

使用道具 举报

发表于 2021-2-18 11:32 | 显示全部楼层
我记得M1主要是加密走专用模块吧,农企在推土机时代加密就是专用模块了,牙膏厂的server也有,桌面版被阉割了。
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-18 11:40 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2021-2-18 11:54 | 显示全部楼层
hgfdsa 发表于 2021-2-18 11:32
我记得M1主要是加密走专用模块吧,农企在推土机时代加密就是专用模块了,牙膏厂的server也有,桌面版被阉割 ...

如果你说AES加速……那么现在的桌面CPU基本都支持

回复

使用道具 举报

发表于 2021-2-18 12:03 | 显示全部楼层
8400gs 发表于 2021-2-18 11:54
如果你说AES加速……那么现在的桌面CPU基本都支持

指令集是指令集,硬加速是硬加速,查了下牙膏厂11代才给桌面加上。
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-18 12:21 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2021-2-18 12:34 | 显示全部楼层
GF从三星那里买来14nm技术就AMD一个用户吧
现在回本了吗?
回复

使用道具 举报

发表于 2021-2-18 12:44 | 显示全部楼层
泉玲奈 发表于 2021-2-18 12:34
GF从三星那里买来14nm技术就AMD一个用户吧
现在回本了吗?

power9也是gf的14nm,不过今年的power10转三星了
回复

使用道具 举报

     
发表于 2021-2-18 12:48 来自手机 | 显示全部楼层
现在制程越来越难提升,在架构方面持续优化是以后的重点,我觉得和下围棋一样,一定数量的晶体管有一个最优的设计方案,但是凭人类的智力不一定找得到。
快进到🐶设计芯片

—— 来自 OnePlus GM1910, Android 10上的 S1Next-鹅版 v2.2.2
回复

使用道具 举报

     
发表于 2021-2-18 13:08 | 显示全部楼层
hgfdsa 发表于 2021-2-18 12:44
power9也是gf的14nm,不过今年的power10转三星了

IBM怎么也选gf这种第三还是第四的厂家啊
成本低吗?
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-18 13:18 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2021-2-18 13:33 | 显示全部楼层
泉玲奈 发表于 2021-2-18 13:08
IBM怎么也选gf这种第三还是第四的厂家啊 成本低吗?

IBM在若干年前把自己的工厂流水线打包卖给GF了,顺便签了个和GF合作若干年的协议,协议期内所有的CPU都交给GF代工。今年应该是到期了
回复

使用道具 举报

发表于 2021-2-18 13:43 | 显示全部楼层
泉玲奈 发表于 2021-2-18 13:08
IBM怎么也选gf这种第三还是第四的厂家啊
成本低吗?

性能高啊,Power9单die 12C全核5.2G,比牙膏厂的14+++强多了
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-18 13:52 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2021-2-18 22:17 来自手机 | 显示全部楼层
这位脸还没被打肿啊,ROME 64C出来的时候自闭了了两周没黑屁的景我还历历在目呢

—— 来自 vivo V1986A, Android 10上的 S1Next-鹅版 v2.2.2.1
回复

使用道具 举报

     
发表于 2021-2-18 22:20 | 显示全部楼层
hgfdsa 发表于 2021-2-18 13:43
性能高啊,Power9单die 12C全核5.2G,比牙膏厂的14+++强多了

等下ZEN 和ZEN+ 上不了高频还是问题啊
回复

使用道具 举报

     
发表于 2021-2-18 22:21 来自手机 | 显示全部楼层
lucky95 发表于 2021-2-18 13:52
下一个拐点在哪,真要等到量子计算成熟吗

— from HUAWEI HLK-L41, Android 9 of S1 Next Goose v2 ...

把现在Risc或者cisc套壳risc处理器设计重新掀翻的时候吧

—— 来自 vivo V1986A, Android 10上的 S1Next-鹅版 v2.2.2.1
回复

使用道具 举报

发表于 2021-2-18 22:30 | 显示全部楼层
泉玲奈 发表于 2021-2-18 22:20
等下ZEN 和ZEN+ 上不了高频还是问题啊

zen用的是高密度工艺,实际密度25M,牙膏的初代14nm只有15M,后面+++后更低。

代工厂兴起之前,牙膏的工艺优势是成本低,IBM系才是真正的高性能。现在代工厂成本性能双双吊打牙膏。
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-19 10:57 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-19 12:03 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-19 19:16 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2021-2-19 23:04 | 显示全部楼层
Gnyueh 发表于 2021-2-18 22:17
这位脸还没被打肿啊,ROME 64C出来的时候自闭了了两周没黑屁的景我还历历在目呢

—— 来自 vivo V1 ...

说来听听
回复

使用道具 举报

     
发表于 2021-2-19 23:40 | 显示全部楼层
lucky95 发表于 2021-2-18 13:52
下一个拐点在哪,真要等到量子计算成熟吗

— from HUAWEI HLK-L41, Android 9 of S1 Next Goose v2 ...

碳纳米管
回复

使用道具 举报

     
发表于 2021-2-20 00:18 来自手机 | 显示全部楼层
本帖最后由 Gnyueh 于 2021-2-20 00:20 编辑

[url=]bbs.saraba1st.com/2b/thread-1827042-1-1.html[/url]
上一篇文章就是批斗现场

—— 来自 vivo V1986A, Android 10上的 S1Next-鹅版 v2.2.2.1
回复

使用道具 举报

     
发表于 2021-2-20 00:18 | 显示全部楼层
能打败魔法的可能不一定是魔法,是机关枪

我见过的这六七年所有的Intel吹,现在全都傻逼了,再谈起这事情就是”哈哈,今天天气真好。“。

技术好是好,可是商业上走过来始终是失败的,其实更多的不是实力问题,是intel没抓住移动端需求大规模增长的机遇期,所以做什么都是错的

感觉业界已经被ASML所选择的技术路径绑架了,当年苦苦提高NA无果,选择浸入式方法换道超车,若干年后的EUV也选择了相同的技术路径

尼康的失败也是因为被EUV LLC排除在外,并不是技术上的失败。
题外话,国内做不出EUV,也是因为没有像美帝一样组建一个行业协会,会战攻关EUV光源,当然国内差的远不止光源

以后加入越来越多的DSA终究是可以给算力的增长续命的,但很显然治标不治本。在2nm以下的节点使用GAA技术,那可能就连密度都无法达到一个可观的增长了,每一代的进步可能都不会超过10%,300MT/mm2就是摩尔定律的终点。

我现在就期待着老黄把ARM收了,彻底玩死这个生态,大家好都去搞RISCV,还能让工艺多往前凸几代,不然可真就要指望实验室里的那些没有二十年落不了地的技术拯救世界了
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-2-20 01:40 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2021-2-20 01:56 | 显示全部楼层
hgfdsa 发表于 2021-2-17 20:44
power9也是gf的14nm,不过今年的power10转三星了

power9用的是12FDX(IBM叫14HP),是GF和IBM在FDSOI路线上搞得高性能14nm工艺,不是从三星买的那个,那个是12LP。
回复

使用道具 举报

发表于 2021-2-20 02:00 | 显示全部楼层
拉倒吧,又一个N7P和N7+和N6都分不清就开始瞎吹的……
I/O分离是不可能的,付出的代价通常会比节省的成本更大。估计只有核心面积600+甚至700+的芯片会把DDR部分再剥离出去用SERDES接口中转,DDR的pin确实是太多了。
回复

使用道具 举报

     
发表于 2021-2-20 02:25 | 显示全部楼层
acalephs 发表于 2021-2-20 01:56
power9用的是12FDX(IBM叫14HP),是GF和IBM在FDSOI路线上搞得高性能14nm工艺,不是从三星买的那个,那个 ...

有14nm FDSOI啊?那农企为什么不考虑用一下…

—— 来自 S1Fun
回复

使用道具 举报

发表于 2021-2-20 02:38 来自手机 | 显示全部楼层
Unlight 发表于 2021-2-19 10:25
有14nm FDSOI啊?那农企为什么不考虑用一下…

—— 来自 S1Fun

出的太晚了,12FDX17年才开始小规模量产,台积电7nm都快出了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-11-14 05:54 , Processed in 0.177192 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表