重新编辑 Xbox Series X 比较有意思几个新特性
本帖最后由 ft5555 于 2020-3-19 15:47 编辑根据外网查到的更多信息合并整理:
引自外网
“使用与SSD速率相匹配的解压缩软件会消耗3个Zen 2 CPU内核。如果加上IO CPU开销,那就是另外两个内核因此,当现在仅占用一个CPU内核的十分之一时,由此产生的工作负载将完全消耗五个Zen 2 CPU内核。换句话说,要使Series X的性能达到其全IO速率,您需要构建一台具有13个Zen 2内核的PC。这是游戏专用的七个内核:一个用于Windows和Shell,五个用于IO和解压缩开销。” 在现有PC IO架构不变的情况下实现对等XSX的性能。
也就是说新架构:
DirectStorage – DirectStorage是一个全新的I / O系统,专门为游戏而设计,以释放SSD的全部性能和硬件解压缩。它是构成Xbox Velocity体系结构的组件之一。现代游戏会在后台执行资产流传输,以在您玩游戏时连续加载世界的下一部分,DirectStorage可以将这些I / O操作的CPU开销从多个核心减少到仅占单个核心的一小部分;从而释放出大量的CPU能力,使游戏可以花在更好的物理效果或场景中更多的NPC等领域。Xbox Series X引入了DirectX家族的最新成员,我们也计划将其引入Windows。
---------------节约出2个zen 2 cpu内核的IO开销,
下图是NV的gpudirect-storage示意图。避免了通过CPU内存中的缓冲区进行额外的拷贝带来的CPU IO负担(上代主机的统一内存架构,也是避免额外拷贝,但是由cpu拷贝到内存中,gpu直接寻址,还是给cpu增加了负担)
====================================================================
“我们的第二个组件是高速硬件解压缩模块,它可以提供超过6GB / s的速度,” Andrew Goossen透露。“这是一个专用的硅块,可从CPU上卸载解压缩工作,并与SSD匹配,因此解压缩永远不会成为瓶颈。解压缩硬件支持Zlib来存储常规数据,并支持一种新的名为BCPack的压缩[系统]。 GPU纹理通常构成游戏包装尺寸的绝大部分。”
硬件解压缩 –硬件解压缩是Xbox Series X引入的专用硬件组件,它允许游戏在SSD上占用尽可能少的空间,同时消除了通常与运行时解压缩相关的所有CPU开销。当以全固态硬盘性能运行时,它可以将解压缩的软件开销从三个以上的CPU内核减少到零个,从而为游戏释放了相当大的CPU能力,从而可以花在更好的游戏玩法和更高的帧率等领域。硬件解压缩是Xbox Velocity体系结构的组件之一
-------------------- 节约出3个zen 2 cpu内核.
也就是说这代主机数据在SSD上是经过压缩后存储的,跨平台游戏的话,PC上安装占用SSD空间要接近翻倍。ps5使用的是Kraken 压缩算法,xsx使用Zlib,但是ps5没提到专用解压缩模块,因为pci-e总线带宽不变,所以解压肯定不是发生在nvme硬盘一侧。
楼下 天神十三煞 说其实是GPU来完成的,
希望这个功能未来能在PC上实现。
=================================================================================
GPU工作创建 – Xbox Series X为GPU工作创建添加了硬件,固件和着色器编译器支持,从而为GPU提供了强大的功能,无需任何CPU协助即可有效处理新的工作负载。这为开发人员提供了更高的灵活性和性能,以实现他们的图形视觉。
---------------------------已经在VULKAN 1.2中实现 ,
NV官网的介绍:
https://devblogs.nvidia.com/new-vulkan-device-generated-commands/,未来应该也会随着win10更新被包含到dx12里,目前看图灵系列gpu支持这个。
读了一下,应该是把cpu向gpu的指令发送过程中由驱动来优化的队列排序,变成了每条指令自带标记,直接塞到显存中不同缓冲区域中,达到同类型打包的目的。还可以根据标记来排序或者乱序执行。
这个设计提升了指令发送效率,还给cpu减负。
ps:感觉win10 20H1的 Hardware-accelerated GPU scheduling说的就是这个功能啊。。。
========================================================================================
采样器反馈流(SFS) – Xbox Velocity体系结构的一部分,SFS是Xbox Series X硬件的一项功能,该功能允许游戏以精细的粒度仅将GPU场景所需的部分纹理加载到内存中,根据需要。这样可以提高纹理的内存利用率,这非常重要,因为每个4K纹理都占用8MB的内存。因为它避免了将不需要的纹理部分加载到内存中的浪费,所以它是物理内存量和SSD性能的有效2倍或3倍(或更高)乘数
------------------RNDA2架构新特性?占未来的资本?
微软的介绍:
https://devblogs.microsoft.com/directx/coming-to-directx-12-sampler-feedback-some-useful-once-hidden-data-unlocked/
Coming to DirectX 12— Sampler Feedback: some useful once-hidden data, unlocked
win10 20H1已经确认支持。引自”这种提高的效率可以将有效物理内存量提高2到3倍,并将I / O带宽提高2到3倍“(是种等效关系,减少了不必要的纹理加载=I/O性能提升)
硬件压缩那个应该不是SSD集成的,应该是主板上有一块专门的硬件压缩卡,所有的数据压缩解压缩由这块卡来完成,CPU只需要发送普通的IO读写指令就可以了,据我所知intel有专门的硬件 SSD主控老早就有压缩解压缩了吧? 本帖最后由 天神十三煞 于 2020-3-16 18:56 编辑
前面两楼完全理解错误
主楼前两个特性合起来差不多就是一个功能
前者就是尽量预判的无缝后台预载
后者意思是GPU直接和SSD交互数据
实现直接GPU解包达成高IO性能
直白的说就是提高读盘性能
其实黄一刀在Linux下早有了,未来win10支持这特性的话,dx类似API就可以实现差不多功能
https://docs.nvidia.com/cuda/gpudirect-rdma/index.html 天神十三煞 发表于 2020-3-17 10:34
前面两楼完全理解错误
主楼前两个特性合起来差不多就是一个功能
前者就是尽量预判的无缝后台预载
应该就是主控压缩吧,哪里提到显卡了……
—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.2 本帖最后由 DeepFishing 于 2020-3-17 21:05 编辑
这玩意主要问题是价格,我感觉699美刀打不住,特性和硬件有关,Windows不一定享受的到吧,pc架构本身限制就很多,有的特性深度这边也会受益,但是农企拉夸的软件,rocm到今天都不支持rdna架构的显卡
—— 来自 Sony H8296, Android 10上的 S1Next-鹅版 v2.2.0.1 现在就看价格了,索尼似乎也要19号谈一谈了……
—— 来自 Xiaomi MI 8 SE, Android 10上的 S1Next-鹅版 v2.2.2 本帖最后由 天神十三煞 于 2020-3-17 10:27 编辑
Gnyueh 发表于 2020-3-17 04:11
应该就是主控压缩吧,哪里提到显卡了……
—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 ...
https://bbs.saraba1st.com/2b/thread-1919336-1-1.html
看图说话,你觉得最后一图为什么要那样标亮连接?十个储存颗粒明显是gpu面的pcb 天神十三煞 发表于 2020-3-18 02:11
https://bbs.saraba1st.com/2b/thread-1919336-1-1.html
看图说话,你觉得最后一图为什么要那样标亮连接? ...
那是APU,并没有分CPU/GPU PCB
而且特性应该是针对内置存储,示意图是外接存储 共谍常凯申 发表于 2020-3-18 09:11
他说的应该是真的,据说是navi20的新特性
https://www.amd.com/zh-hans/products/professional-graphics/radeon-pro-ssg
17年的产品 天神十三煞 发表于 2020-3-18 02:11
https://bbs.saraba1st.com/2b/thread-1919336-1-1.html
看图说话,你觉得最后一图为什么要那样标亮连接? ...
这不是板载的1T SSD啊,
AMD 的单芯片APU(又不是只有GPU,那上边既有GPU还有ZEN 2 CPU甚至还有南北桥)祖传SoC设计
存储卡连到APU的北桥上有什么问题吗
—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.2 本帖最后由 天神十三煞 于 2020-3-17 23:14 编辑
Gnyueh 发表于 2020-3-17 18:37
这不是板载的1T SSD啊,
AMD 的单芯片APU(又不是只有GPU,那上边既有GPU还有ZEN 2 CPU甚至还有南北桥)祖 ...
重新看了下UMA通道图,可能我被颗粒布局和spec表10+6迷惑了。
不过你们看看这个解析,从15分钟开始,关于一些新特性
https://www.bilibili.com/video/av96931981
首先速率架构可以让问SSD作为系统一部分“虚拟内存”可以被CPU和GPU直接访问其资源
有单独的解压块管理组件,但不是直接讲成硬件解压芯片,
这部分是作为监控素材资源被访问情况而实现更好预载和传输解压来用的
官方图介绍直接刻意亮标SSD或外部储存直连,
这种事情为什么要在特性介绍时做,是不是觉得和硬件厂PPT介绍新总线啊或新接口时的感觉很类似?
然后你们觉得游戏那种简单打包什么解压更快,在能简单粗暴用一群小学生拼量的情况下专门做额外硬解芯片有必要吗?
当初给开发者看的时候介绍这特性就叫GPU decompression
后来才改名办整了个DirectStorage啥巴拉巴拉的 本帖最后由 天神十三煞 于 2020-3-17 23:28 编辑
yukika 发表于 2020-3-17 17:29
https://www.amd.com/zh-hans/products/professional-graphics/radeon-pro-ssg
17年的产品 ...
这spec表上不是明白说了Radeon SSG这是把储存作在了显卡上,可能我上面帖黄一刀产品没说清楚,这总线设计是有区别的
之前就算可以实现GPU解压,也是要过CPU和内存再进GPU的,这个是让GPU通过定制的管线来访问外存读资源素材包进行解压
天神十三煞 发表于 2020-3-18 14:55
这spec表上不是明白说了Radeon SSG这是把储存作在了显卡上,可能我上面帖黄一刀产品没说清楚,这总线设计 ...
有可能我们说的不是一个问题,,,
—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.2 本帖最后由 ft5555 于 2020-3-18 20:32 编辑
天神十三煞 发表于 2020-3-18 14:52
重新看了下UMA通道图,可能我被颗粒布局和spec表10+6迷惑了。
不过你们看看这个解析,从15分钟开始,关于 ...
gpu在游戏过程中解压不影响fps吗?
=====================================
看来确实像HBCC
ft5555 发表于 2020-3-18 04:27
gpu在游戏过程中解压不影响fps吗?
就像HDD换SSD都不影响实际帧率的
是加快读盘的时候解包速度啊,以及实现那个几个游戏迅速切换,从睡眠态从SSD迅速释放到内存[显存]里
天神十三煞 发表于 2020-3-18 20:32
就像HDD换SSD都不影响实际帧率的
是加快读盘的时候解包速度啊,以及实现那个几个游戏迅速切换,从睡眠态 ...
DirectStorage因为减少了cpu的 i/o操作 能增加游戏可用cpu资源来提升游戏效果理解。
官文GPU decompression对游戏fps提升还是没太想通, 本帖最后由 天神十三煞 于 2020-3-18 05:08 编辑
ft5555 发表于 2020-3-18 04:50
DirectStorage因为减少了cpu的 i/o操作 能增加游戏可用cpu资源来提升游戏效果理解。
官文GPU decompres ...
我认为主要是释放CPU压力提高IO效率,官网原文确实有点迷惑,一定要提的话
就是沙盒类无缝载入方面有帧率影响,具体要看怎么分配操作,等之后再详解了
本帖最后由 ft5555 于 2020-3-19 12:14 编辑
天神十三煞 发表于 2020-3-18 20:57
我认为主要是释放CPU压力提高IO效率,官网原文确实有点迷惑,一定要提的话
就是沙盒类无缝载入方面有帧率 ...
这么解释倒是还算通:因为ssd的数据是压缩过的,所以相比cpu解压 gpu解压在无缝载入时性能影响更小吧
因为原文提到了更小的ssd占用 这io 特性用在数据库里多好 天神十三煞 发表于 2020-3-18 20:57
我认为主要是释放CPU压力提高IO效率,官网原文确实有点迷惑,一定要提的话
就是沙盒类无缝载入方面有帧率 ...
查了一些资料,重新编辑了主楼。
感觉现在就是ps5跟xsx到底是gpu解压还是有专门芯片协助 没最终定论了。 本帖最后由 天神十三煞 于 2020-3-18 23:57 编辑
ft5555 发表于 2020-3-18 23:13
查了一些资料,重新编辑了主楼。
感觉现在就是ps5跟xsx到底是gpu解压还是有专门芯片协助 没最终定论了。 ...
问了下舅舅党,应该是这两主机两者都有,GPU负载低的时候,比如读盘时间就主要靠GPU
如果是开放世界类GPU负载较高,就解压芯片辅助CPU,所以有让CPU降到3或0的说法,大概是辅助芯片没GPU算力那么强力
天神十三煞 发表于 2020-3-19 15:55
问了下舅舅党
应该是两者都有
GPU负载低的时候,比如读盘时间就主要靠GPU
单独芯片的话 ,在pc上实现的可能性就低了。。
本帖最后由 天神十三煞 于 2020-3-19 00:05 编辑
ft5555 发表于 2020-3-18 23:58
单独芯片的话 ,在pc上实现的可能性就低了。。
但是PC其实对这种IO提升需求不是太迫切
首先本身现在开放世界的无缝预载你在PC也感受不到啥鸭梨
然后至于游戏初始化预载关卡类读取PC党本身都用了SSD好多年了,速度快到一定时间短的话,体感差距不大了
何况PC内存显存更大,可以预先塞更多东西,再不济可以挂着很多游戏都不关实现XSX的功能
天神十三煞 发表于 2020-3-19 15:55
问了下舅舅党,应该是这两主机两者都有,GPU负载低的时候,比如读盘时间就主要靠GPU
如果是开放世界类GPU ...
重新确认了一下实现,PS5的是用专门硬件ASIC压缩之后再传给主控写入的,不是靠GPU
—— 来自 Xiaomi MI 5s Plus, Android 8.0.0上的 S1Next-鹅版 v2.2.2 天神十三煞 发表于 2020-3-19 16:01
但是PC其实对这种IO提升需求不是太迫切
首先本身现在开放世界的无缝预载你在PC也感受不到啥鸭梨
然后至于 ...
感觉这个主要还是助力 ssd做cache 跟多游戏无缝切换用的。
因为xsx给游戏分配的内存毕竟只有3.5G 。肯定需要大量的ssd cache
巫师3 pc版最高画质内存占用远超这个数了。 Gnyueh 发表于 2020-3-19 16:02
重新确认了一下实现,PS5的是用专门硬件ASIC压缩之后再传给主控写入的,不是靠GPU
—— 来自 Xiaomi MI...
听说ps5还有个独立音频芯片? (`・ω・´) gpu访问硬盘资源这个我大概17年就用过了,postgresql的cuda加速插,有用到这个功能
—— 来自 vivo NEX S, Android 9上的 S1Next-鹅版 v2.1.0-play ft5555 发表于 2020-3-19 16:20
听说ps5还有个独立音频芯片?
让我想起了ps2独立音频芯片了 iceprince10 发表于 2020-3-21 12:25
ltt直播说It's a pc,还没看全程不知道是不是意味着可以用windows,可以的话市面上基本所有非工作站用itx可 ...
如果能随便安装uwp应用。。。
页:
[1]