找回密码
 立即注册
搜索
查看: 2601|回复: 18

[硬件] 【授权转载】【翻译】30系显卡NV官方问答

[复制链接]
     
发表于 2020-9-3 12:13 | 显示全部楼层 |阅读模式
本帖最后由 zxw11211 于 2020-9-3 12:14 编辑

原帖地址:[https://www.reddit.com/r/nvidia/comments/ilhao8/nvidia_rtx_30series_you_asked_we_answered/]
NV官方Justin Walker(NV 桌面卡 PM)的答复。


翻译原帖 nga用户@AX.Procyon
翻译贴转载已获得翻译作者同意

看完问答,我自己作为10系钉子户觉得可以毫不犹豫的上3080了

30系 你问我答 NV官方对一些问题的回应 NGA玩家社区 P1
https://ngabbs.com/read.php?tid=23213326&_ff=334

==============以下为翻译贴原文==============

免责声明:此贴仅为翻译,我和NV没关系,翻译不准以原帖为准,别问我问题,我也不知道 我就是个翻译的
===============================
挑重要的翻译了 篇幅太长不可能全文对应翻译了

Q:为啥3080才10G显存?和前代的提升不够大
A:3080的目标是4K全最高画质下价格适中。举例:本世代3A大作如SOTTR,奥德赛,地铁离去,德军总部新血脉,战争机器5,无主之地3,荒野大镖客2于3080上运行4K全最高画质(包括使用高清素材包) 在60-100fps下也只使用了4-6GB显存 因此为了压低售价控制成本采用了10GB的G6X。

===========================================

Q:3070比2080Ti更快指的是光追+DLSS性能还是传统光栅化性能?
A;我们指的是两者都是。

===========================================

Q:HDMI2.1是满血48Gbps吗?
A:是,最高可以支持通过DSC的8K 60 HDR

===========================================

Q:可以解释下为何本代的CUDA核心数直接翻倍吗?如何喂饱所有FP32核心?如何保证占用率均衡?
A:30系的SM设计目标即为两倍图灵的FP32性能。因此我们为FP32和INT32设计了新的数据路径(datapath)。一组路径包含了16 FP32核心 每个时钟周期可以执行16条FP32指令;另一条路径包含16个FP32和16个INT32核心。由于此设计,每个安培SM可以选择执行每个时钟周期32条FP32命令,或者16条FP32+16条INT32操作。四组SM相加可以每个时钟周期执行128条FP32指令,相比于图灵的单个SM 每个时钟周期执行64条FP32+INT32指令翻倍。…(此段略)…2x数学操作输出需要2x数据路径的支持 因此安培架构每SM的共享记忆体和L1缓存性能也翻倍(每周期128Bytes,图灵为64B)。3080的总L1带宽为219GB/s(2080S为116GB/s)。…(此段略)…更多关于安培架构的细节将于日后的英伟达安培架构**中发布。

===========================================
Q:新公版散热的设计在倒置风道的机箱内是否会造成问题?第二,3090比Titan安静10倍是什么意思?
A:新的穿透流式散热器在机箱风道能够给GPU带来新鲜空气并且能把热空气移除就能达到效果,和是否倒置无关。静音效果指的是与Titan RTX和2080S FE相比,并非第三方设计。

===========================================
Q:30系卡是否支持10bit 444 120FPS输出?
A:是。30系支持10bit HDR。HDMI2.1最高可支持8K 60 12bit HDR,其中包含了10bit HDR的支持。

===========================================
Q:PCIe 3.0是否会造成性能损失?
A:一般而言从PCIe 4.0x16到PCIe 3.0x16的性能损失不会高于个位数百分比。CPU性能对GPU的表现更加重要。我们希望有更多的新平台能够支持PCIe4让GPU满血发挥。

===========================================
…(略去一个问题)…
===========================================
Q:RTX IO是否是使用SSD作为显存?
A:否。RTX IO允许显卡直接从SSD读取数据,快于传统方法,并且使得数据可以以GPU可读的压缩模式存储,解压和读取。此功能更多是减少CPU的负荷和性能损耗。

===========================================
Q:RTX IO是否对SSD性能有门槛要求?
A:否。事实上RTX IO并不需要SSD。但是显然,SSD尤其是PCIe 4.0 SSD会有优势。日后的游戏视开发者需求可能会有SSD的要求。不论SSD性能如何,RTX IO都会给SSD提速,原理是减少CPU的负荷并且允许GPU解压。一般而言游戏的压缩率约为2:1,因此绕过CPU等效于SSD读取性能x2.

===========================================
Q:新卡的Win7、Win8.1支持?
A:新卡可以于Win7和Win10运行。RTX IO于Win10支持。

===========================================
Q:RTX IO具体是如何工作的?如果我有NVMe SSD,30系新卡和最新的驱动,是否我只需要等待Win10 更新DirectStorage API即可?
A:RTX IO he DirectStorage需要应用本身支持这些API。微软准备于明年开始放出对开发者的包含DirectStorage的Windows预览版。RTX显卡用户将于这些更新就位后即可使用RTX IO。

===========================================
Q:NVIDIA Broadcast是否会取代GFE/shadowplay的本地录屏?
A:否。NVIDIA Broadcast仅是一个插件应用,并不具备录屏功能。不会取代GFE和Shadowplay

===========================================
Q:新一代的解编码器是否会有更新提升?
A:30系的侧重是解码提升,因此我们引入了AV1硬解支援。编码器同20系。同时会有新的SDK。
……(此问题略,和上一问几乎相同)…

===========================================
Q:AV1硬解是否是3090独占?
A:否。30系所有显卡搭载的是同样的第五代硬件解码器。
===========================================
…(Machinema和Studio的两问略)…
===========================================
Q:NVIDIA Reflex是新显示器硬件的一部分还是一个软件?
A:都是。NVIDIA Reflex 延迟分析器是G-Sync处理器新的一部分,可以测量总系统延迟。此外,Reflex SDK可以被整合进游戏中并启用超低延迟模式以减缓系统延迟。此功能支持900系及以上。这些功能都可以单独启用。

https://ngabbs.com/read.php?&tid=23213326

===========================================





评分

参与人数 1战斗力 +1 收起 理由
Dox + 1

查看全部评分

回复

使用道具 举报

     
发表于 2020-9-3 12:35 | 显示全部楼层
编码器没提升…去年买了 1650s 压片的笑开花
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-3 12:38 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-3 12:42 | 显示全部楼层
有口皆悲 发表于 2020-9-3 12:38
HDMI2.1是90独占吗?

70 80 90都有hdmi2.1

评分

参与人数 1战斗力 +1 收起 理由
有口皆悲 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-3 12:49 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-3 12:54 来自手机 | 显示全部楼层
还真是一个SM内64 FP32 + 64 FP32/INT32这种设计,调度资源应该没加所以显得效率下降,下一代可能就是资源增长不大但效率提高了。
感觉有点fermi到kepler再到maxwell的意思。
回复

使用道具 举报

     
发表于 2020-9-3 13:04 | 显示全部楼层
满血hdmi2.1啊,前几天看hdtvtest说是新一代xbox是40gbps,没满血,老黄这次是可以说各种意义上的配置拉满

  -- 来自 能搜索的 Stage1官方 iOS客户端
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-3 13:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-3 13:12 来自手机 | 显示全部楼层
66666 发表于 2020-9-3 13:06
因为本来图灵SM就是双发射,只不过执行单元就2个,现在增加3个并不需要弄三发射,毕竟int32指令并不多而 ...

不是单发射双周期运行吗?turning才16int 16fp塞双发射有什么用
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-3 13:16 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-3 14:26 | 显示全部楼层
66666 发表于 2020-9-3 13:16
谁说只有单发射的?图灵都出2年了,**上写的清清楚楚SM里两个发射,单周期可以同时发射16个FP32和16个int ...

whitepaper上写的是每个processing block有16int 16fp,每周期发射一个warp(32thread),哪里有双发射了。
而且单发射双周期运行不就正好保证运算单元满载么,多塞一个发射单元除了闲置还有什么用。
回复

使用道具 举报

发表于 2020-9-3 15:44 | 显示全部楼层
不知道是否会早点出3050
这个要是能有的话 应该足够应付1080P了吧
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-3 15:46 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-3 15:54 | 显示全部楼层
cybernetics31 发表于 2020-9-3 13:04
满血hdmi2.1啊,前几天看hdtvtest说是新一代xbox是40gbps,没满血,老黄这次是可以说各种意义上的配置拉满
...

LG今年出了几个新电视也不是满血2.1接口,对比去年的产品还倒退了
回复

使用道具 举报

     
发表于 2020-9-3 16:56 | 显示全部楼层
66666 发表于 2020-9-3 15:46
有专门的int指令发射单元,不然怎么做到int和FP32指令并行运行?一个warp下只是data有区别,指令都是同一 ...

这个周期发warp a给fp32,下个周期发warp b给int32,两组单元各自都要算两个周期,这不就并行了嘛
回复

使用道具 举报

头像被屏蔽
     
发表于 2020-9-3 17:21 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2020-9-3 17:35 | 显示全部楼层
66666 发表于 2020-9-3 17:21
data又不是能每次正好能填满一个warp,你这种做法流水线长时间都吃不饱,GPU设计师这么玩早就下岗了 ...

解决这个问题不是应该在thread管理那边去做嘛,和每周期发射能力有什么关系
回复

使用道具 举报

     
发表于 2020-9-3 18:20 | 显示全部楼层
内森德雷克 发表于 2020-9-3 15:54
LG今年出了几个新电视也不是满血2.1接口,对比去年的产品还倒退了

今年就美国那个vizio是满血,估计各家都是商量好的,三星家的也不是满血,再加上xbox,老黄的卡估计真得配个8k电视
回复

使用道具 举报

     
发表于 2020-9-3 20:10 | 显示全部楼层
应该问问为什么取消了usb-c接口
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-9-25 07:22 , Processed in 0.136703 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表