血河之舞 发表于 2022-9-21 16:45

Dox 发表于 2022-9-21 16:59

dlss这东西影响延迟不,找到了篇研究说还能减少延迟,有点反直觉
https://raiseyourskillz.com/zh-CN/should-i-turn-nvidia-dlss-on-or-off/

囧囧囧 发表于 2022-9-21 18:04

那就是老卡继续享受dll更新。

FLZB 发表于 2022-9-21 18:11

Dox 发表于 2022-9-21 16:59
dlss这东西影响延迟不,找到了篇研究说还能减少延迟,有点反直觉
https://raiseyourskillz.com/zh-CN/shoul ...

帧数更高了延迟当然就降低了

御风沐雪 发表于 2022-9-21 18:17

从这个角度 是不是捡矿也别买6800 还是要买3070要dlss

niubility 发表于 2022-9-21 18:40

御风沐雪 发表于 2022-9-21 18:17
从这个角度 是不是捡矿也别买6800 还是要买3070要dlss

a卡有rsr,所有游戏都能享受

—— 来自 Xiaomi Mi 10, Android 12上的 S1Next-鹅版 v2.5.4

Flyfish233 发表于 2022-9-21 18:44

niubility 发表于 2022-9-21 18:40
a卡有rsr,所有游戏都能享受

—— 来自 Xiaomi Mi 10, Android 12上的 S1Next-鹅版 v2.5.4 ...

fsr支持所有显卡,包括n
等50系出来我再考虑买不买
希望a那边能弄一个真正能打dlss的东西出来,或者dlss再增强到基本不缩画质

niubility 发表于 2022-9-21 19:01

Flyfish233 发表于 2022-9-21 18:44
fsr支持所有显卡,包括n
等50系出来我再考虑买不买
希望a那边能弄一个真正能打dlss的东西出来,或者dlss ...

rsr和fsr不一样的,rsr直接集成在驱动,不需要游戏特地去适配。

—— 来自 Xiaomi Mi 10, Android 12上的 S1Next-鹅版 v2.5.4

fateultraone 发表于 2022-9-21 19:12

其实官方也说死20,30系不支持dlss3.0的光流游戏插帧,nv工程师刚回复说可以支持以前的gpu架构,但需要新方法在光流和ai模型上进一步优化,估计就看40系卖的好不好了,卖的不好估计就会支持30系了

囧囧囧 发表于 2022-9-21 19:13

niubility 发表于 2022-9-21 19:01
rsr和fsr不一样的,rsr直接集成在驱动,不需要游戏特地去适配。

—— 来自 Xiaomi Mi 10, Android 12上 ...

两者没可比性。fsr2.0也还没到能相提并论的时候。

血河之舞 发表于 2022-9-22 06:08

血河之舞 发表于 2022-9-22 08:20

WhiteGlint 发表于 2022-9-22 08:56

灵活支持

Dox 发表于 2022-9-22 10:20

血河之舞 发表于 2022-9-22 08:20
另外NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro也回复了关于DLSS3光流插帧带来的延迟问题:

“NVIDIA ...

看来这个光流插帧和之前的缩放加帧的方式不同,所以会产生延迟
不过光流插帧的画质应该会比缩放加帧好一些,各有优势

takeya 发表于 2022-9-22 10:35



—— 来自 OnePlus LE2100, Android 12上的 S1Next-鹅版 v2.5.4

查理三世 发表于 2022-9-22 10:40

放心,老黄肯定阉割

查理三世 发表于 2022-9-22 10:41

前两天重新打刺客信条黑旗的时候发现新驱动已经完全不支持physx了,游戏内打开选项之后帧数爆降

出轨的三头龙 发表于 2022-9-22 10:51

就算能用也要有游戏支持啊,dlss3能支持赛马娘色模型在恋活里4k120hz扭屁股吗?

血河之舞 发表于 2022-9-22 11:30

比亚迪 发表于 2022-9-22 11:30

这个也不算是插帧吧,应该叫预渲染像素?**下一帧的部分像素,剩下的靠还是实时渲染那些变化量较大的像素,估计即时战略类这种固定视角背景的游戏收益最高,然后是赛车类图像规则运动收益也不小,但FPS类的游戏,可能收益相对小一些

囧囧囧 发表于 2022-9-22 12:29

比亚迪 发表于 2022-9-22 11:30
这个也不算是插帧吧,应该叫预渲染像素?**下一帧的部分像素,剩下的靠还是实时渲染那些变化量较大的像素, ...

老黄说一整个帧都不经过渲染管线生成,但作为依据的那个帧应该是可以采用超采样合成的帧(dlss2原理合成的)。那我比较好奇的是光追游戏摄像机角度变化的时候光线不用再走一遍遍历吗?遇到自发光物体譬如变色的霓虹灯那这个光源产生的光照也不用重新计算?全靠optic flow处理器和tensor core推理就行了?
结合reflex使用我理解为尽量降低录入玩家下一步操作的延迟为推理节省时间,但是整个帧的每个像素只靠前一帧信息+运动向量信息推理而不需要经过shaders/rtcore/tmu参与计算,很难想象怎样能做到精确。

囧囧囧 发表于 2022-9-22 12:38

视频插帧理论上应该更好实现,帧n-1和n+1的信息是已知的,那帧n的内容完全可以且适合由tensor来干。

fateultraone 发表于 2022-9-22 13:23

血河之舞 发表于 2022-9-22 06:08
能运行不代表效果好,20和30系光流加速性能低,硬上3.0不会比目前2.x快,没有实际意义,就如同10系显卡跑 ...

能给你体验一下总比软件锁定好,而且官方这说法就是摸棱两可又没一口咬定说行不通,20,30系远没到淘汰的地步这又给自家新卡做排他性功能,老黄现在搞的这些策略就是反消费者的,参考intel的xess还有dp4a这条路径给没有xe core的显卡来用这才是正常的做法,老黄这种为了卖自家的新卡忽视旧卡的支持已经很难得到消费者支持了

Flyfish233 发表于 2022-9-22 13:33

囧囧囧 发表于 2022-9-22 12:38
视频插帧理论上应该更好实现,帧n-1和n+1的信息是已知的,那帧n的内容完全可以且适合由tensor来干。 ...

但是老黄觉得讲良心就是亏,臭打游戏的好人难做很多人为了dlss准备买新卡,我只能说好似

血河之舞 发表于 2022-9-22 14:45

血河之舞 发表于 2022-9-22 14:49

囧囧囧 发表于 2022-9-22 15:34

Flyfish233 发表于 2022-9-22 13:33
但是老黄觉得讲良心就是亏,臭打游戏的好人难做很多人为了dlss准备买新卡,我只能说好似 ...

tse能跑上2w这钱就可以掏。换了屏才晓得3090多弱。

rhocas 发表于 2022-9-22 15:55

fateultraone 发表于 2022-9-22 15:57

血河之舞 发表于 2022-9-22 14:49
我觉得这个类似于CPU里面的矢量指令集,按照NV说法光流插帧需要FP8格式的AI加速,前几代Tensor不支持那也 ...

这官方QA里哪里说了dlss 3.0的插帧是必须要依赖新Tensor core的fp8加速,官方介绍里只说了最主要依赖40系改进的高速光流加速器来实现,nv的副总裁也在推上说了通过额外的研究就可以让这项技术在旧卡上运行,虽然好处没40系那么多但仍然是可以实现的,像intel的xess通过独特的xe core能加速的更多,通用的dp4a指令加速的少但能支持更多的显卡就仍然是个很好的卖点值得花时间做出来,avx512对intel的重要性远远不能和dlss相提并论,dlss可是现在n卡最大的卖点还把这个玩分割给自家rtx卡做排他性就是不可取的,而avx512用途太少现在都已经被intel给抛弃了

囧囧囧 发表于 2022-9-22 16:20

fateultraone 发表于 2022-9-22 15:57
这官方QA里哪里说了dlss 3.0的插帧是必须要依赖新Tensor core的fp8加速,官方介绍里只说了最主要依赖40系 ...

兴许就是xess和dp4a之间的关系,不过nv那个是黑箱,outel是内外之分nv是新旧之分。

andychen 发表于 2022-9-22 16:28

血河之舞 发表于 2022-9-22 11:30
还是等具体测试了,这个新模式潜力巨大但坑也有很多,不知道nv就搞到那种程度,如果效果👌🏻话感觉用在视 ...

不出意外这次实际上是视频插帧反向引入DLSS

—— 来自 Sony XQ-AS72, Android 12上的 S1Next-鹅版 v2.5.4

andychen 发表于 2022-9-22 16:31

Dox 发表于 2022-9-22 10:20
看来这个光流插帧和之前的缩放加帧的方式不同,所以会产生延迟
不过光流插帧的画质应该会比缩放加帧好一 ...

过去是通过前后两个低分帧+向量信息生成一个最新高分帧,本身已经会引入延迟
现在还要通过两个前后高分帧再生成一个中间的高分帧,这个高分帧还不是最新帧,延迟影响是几何级数上升了

—— 来自 Sony XQ-AS72, Android 12上的 S1Next-鹅版 v2.5.4

Flyfish233 发表于 2022-9-22 16:48

andychen 发表于 2022-9-22 16:31
过去是通过前后两个低分帧+向量信息生成一个最新高分帧,本身已经会引入延迟
现在还要通过两个前后高分帧 ...

所以通过绑定reflex来加强体验

囧囧囧 发表于 2022-9-22 17:00

andychen 发表于 2022-9-22 16:31
过去是通过前后两个低分帧+向量信息生成一个最新高分帧,本身已经会引入延迟
现在还要通过两个前后高分帧 ...

是前后推理中间?我以为是前推现。

血河之舞 发表于 2022-9-22 17:06

fateultraone 发表于 2022-9-22 17:22

血河之舞 发表于 2022-9-22 17:06
This is possible only on the Ada graphics architecture, because of a hardware component called opt ...

"This is possible ..." 这篇文章不是tpu自己写的推测?和官方QA有什么关系,官方介绍里也从来没没这么说过必须要fp8,nv的员工只回复了
“Support for previous GPU architectures would require further innovation and optimization for the optical flow algorithm and AI model."
还有nv副总裁回复的
”It’s theoretically possible that with additional research and engineering that we could get this technology working on other cards, although it wouldn’t provide as much benefit. The current version only works on 4000-series cards.“
这些摸棱两可的话,没说过在旧rtx卡上跑的都不如dlss 2.0这种话

andychen 发表于 2022-9-22 17:33

囧囧囧 发表于 2022-9-22 17:00
是前后推理中间?我以为是前推现。

现在帧包含未知信息,没法通过AI无中生有的,一定得通过管线渲染
要无中生有只能生成过去帧

囧囧囧 发表于 2022-9-22 17:39

andychen 发表于 2022-9-22 17:33
现在帧包含未知信息,没法通过AI无中生有的,一定得通过管线渲染
要无中生有只能生成过去帧 ...

有相关解释了吗?老黄说法我记得是前+运动信息推现。

血河之舞 发表于 2022-9-22 19:23

血河之舞 发表于 2022-9-22 19:31

页: [1] 2
查看完整版本: 英伟达官方回复DLSS3.0兼容性