诠释最炫RGB显卡！耕升GeForce RTX 4090 炫光 OC评测

业界

TIME

2022-10-28 10:10

中关村在线

　　从Ampere到AdaLovelace，NVIDIA耗费了两年时间，RTX4090 给我们带来的是几乎两倍于RTX3090Ti 的性能表现，第三代光追技术和第三代DLSS技术再一次告诉世界，NVIDIA仍然是这个星球上最懂图形技术、最能够带来惊艳GPU芯片的半导体公司。

　　我们已经为大家带来了包括公版显卡在内的多款RTX4090 评测，这一代的非公显卡在设计上可以说是各显神通，每一个AIC厂商对RTX4090 都有着不一样的理解。今天的主角是来自耕升的GeForceRTX 4090 炫光OC，它可能是当前市场上运用了最多RGB灯光元素的RTX4090，下面我们一起来探索这块最炫RGB显卡。

1耕升GeForceRTX 4090 炫光OC概览

　　作为最为老牌的显卡厂商之一，耕升的每一代产品都会在设计上给大家带来多样化的选择，顾名思义，“炫光”系列就是主打外观灯光效果的系列产品。

　　耕升 RTX 4090 炫光 OC产品综述|图片(5)|参数|报价|点评

　　耕升GeForceRTX 4090 炫光OC的正面采用了镜面效果的钢琴烤漆工艺设计，这种工艺在当下的电子产品上已经不太多见，它的优点是表面有着极佳的光泽效果，能够最大程度地表达光之艺术，缺点则是容易沾染指纹。当然对于显卡来说，沾指纹的缺点可以忽略，毕竟放到机箱里面后，很难再会把它拿出来把玩。

　　在显卡没有点亮的时候，耕升GeForceRTX 4090 炫光OC显得比较低调，不过一旦将它运转起来，就能够感受到溢出的RGB效果，整个显卡的正面、侧面都被RGB元素笼罩了起来。而且与其它显卡在不开灯状态下也能够看到表面纹理的设定不同，耕升GeForceRTX 4090 炫光OC的线条设计只有在运行状态下才能够体验得到，给玩家带来“进化”的感觉。

　　值得一提的是，随机附带的显卡支架也能够支持ARGB灯光效果，连同显卡的光效都可以通过升级版GW-SOUL调控软件进行设置，实现全局的灯光同步。

　　耕升GeForceRTX 4090 炫光OC搭载了第二代“炫之黑曜石”散热器，全新升级成由2个102mm和1个92mm风扇组合而成的强效风扇系统，配合第二代耕升“炫风之刃”造型的扇叶设计，让加宽的9叶特殊叶型扇叶在相同的转速下提升空气流量，增强散热效果，降低显卡的温度压力。

　　显卡后侧也采用了镂空设计，让冷空气可以直接穿透显卡的散热鳍片，提升空气循环速度，加快核心的热量散发。

　　第二代“炫之黑曜石”散热器还运用了特大面积散热鳍片，内置8根复合式热管，并且在热管中进行镀镍设计以提升抗氧能力，从而进一步提高显卡的散热效率。

　　耕升GeForceRTX 4090 炫光OC的背面设计相对朴实了一些，一块金属背板覆盖了显卡PCB，耕升的品牌元素印刷在显卡左侧。

　　显卡顶部惯例是16pin12VHPWR 供电接口，支持全新PCI-E5.0 供电规范，出厂自带了一组12VHPWR转4*8Pin供电线，兼容旧型号电源无难度，最高可提供600W供电能力，为后续超频奠定基础。

　　耕升GeForceRTX 4090 炫光OC采用三槽设计，提供了三个DP1.4和1个HDMI2.1 显示输出接口，至于呼声较高的DP2.0，其实目前绝大部分消费级游戏显示器都没有实装，且DP1.4a 标准也能够支持8K60Hz刷新率的显示器。所以，综合来看，绝对够用。

　　总体来说，耕升GeForceRTX 4090 炫光OC的灯光效果非常吸睛，与关机状态下的外表形成了鲜明反差，应该会受到许多RGB爱好者的青睐。

2NVIDIA Ada Lovelace架构

　　本次发布的GeForceRTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造，采用TSMC4nm定制工艺（TSMC4 nm NVIDIA Custom Process），旗舰核心AD102达到了恐怖的760亿个晶体管，而在RTX30系显卡中为280亿个。

　　与上一代NVIDIAAmpere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升。最高可达到90-TFLOPS的着色器数据吞吐量，而本次发布的GeForceRTX 4090则达到83-TFLOPs，相比上一代NVIDIA Ampere则只有40-TFOPs。

　　完整的AD102核心共有18432个CUDA，其中包含12个图形处理集群(GPCs)，72个纹理处理集群(TPCs)，144个流式多处理器(SMs)。144个第三代光追核心（RTCores）、576个第四代张量核心（TensorCores）。另外可以看到Boost频率也从1.9GHz猛增到了2.5GHz。

　　另外一点在架构图上没有体现的是，AD102核心还包含288个FP64双精度浮点核心(每SM2个)，用来确保FP64代码正确处理，包括FP64张量核心代码。

　　通常来讲，单精度浮点运算会用于深度学习模型训练，而双精度浮点运算则用于数值模拟工作。通常游戏卡都会砍掉FP64，这既节省了成本，又对游戏本身没有影响。而专业卡都保留有FP64，目的就是为了精度更高训练与计算。

　　此次资料中只提到了AD102核心搭载了288个FP64，尚不知道后续的推出的产品有无变更。

　　了解了完整的GA102核心，我们再来看一下RTX4090的核心，其实知道了RTX4090的参数，我们大概也能了解到后续可能推出的“Ti”系列究竟相差在哪。

　　相比完整的GA102来说，RTX4090共有16384个CUDA，其中包含11个GPC、64个TPC以及128个SM单元，第三代RTCores为128个，第四代TensorCores为512个。

　　其实根据完整的架构图就能看出，此次Ada架构整体结构性的改动并不大，这一点从SM单元便能清晰印证，同样的FP32CUDA核心，同样的FP32/INT32混合CUDA核心，同样的L1级缓存等等。当然，每个SM单元内部的TensorCore升级为第四代。

　　不过变化最为显著的，则是第三代光追核心，我们结合两代架构来看。在第二代光追核心中，包含负责边界交叉测试的BoxIntersection Engine引擎，和负责三角形交叉测试的TriangleIntersection Engine引擎。

　　而在第三代光追核心中，还增加了两个新的引擎：OpacityMicro-Map Engines（OMM）和DisplacedMicro-Mesh Engines（DMM），这两个新的硬件单元可以极大地提升光追性能（具体原理后文详细介绍）。

　　至此，每2个SM单元组成一个TPC单元，每6组TPC单元组成一个完整的GPC顶层单元（在部分核心中，会出现5组TPC组成一个GPC单元的情况）。

　　而每个GPC单元又搭载一个独立的光栅引擎、两组ROP分区（每组包含8个ROP单元）。

　　过多关于数数的部分就不再介绍了，毕竟此次架构图的大面上与NVIDIAAmpere架构基本相同，下面我们分别来看看，除了性能Ada架构还有哪些升级。

　　ShaderExecution Reordering （SER）着色器执行重排序

　　SER主要的作用是提升着色器性能，它可以将效率低下的工作负载，动态重组为更高效的工作负载。主要针对光线追踪的性能提升非常大。

　　简单地说，GPU在执行类似工作的时候效率最高。但随着光追效果越来越强大，每个场景可能有数百万条光线照射在不同材质上，而我们知道不同材质的反射率，以及反射效果也是不同的。所以这样就为着色器创建了大量的、发散的，效率低下的工作负载。

　　SER则可以将这些杂乱的指令重新分门别类，动态重组为更高效的工作负载。根据NVIDIA的说法，SER可将着色器性能最多提升2倍，并将游戏帧率最高提升25%。

　　举个简单的例子，当光线第一次从发射端到碰撞端是非常有规律的射线，而碰撞到物体后的二次光追，则会出现大量发散的、无规律的反射，这对于光追负载是非常高的。而从图中便能看到，SER可以将这些指令进行二次排序，以发挥出着色器的最大性能。

　　不过好在这么实用的功能并不是RTX40系的专利，它是一个易于集成的SDK，目前需要游戏开发商集成在游戏中。另外由于它是一个通用的逻辑，后续也有可能直接集成在Windows的API中，这样游戏开发者就无需特意引用，直接调用系统API即可。

　　可以说SER对于手持RTX20系及以上（能够开启光线追踪）的N卡用户来说，是极大地福音。毕竟免费提升的光追性能，谁不喜欢呢。

　　第三代RTCores

　　RTCore的作用在于更快的光线追踪计算能力，如果说在RTX30系显卡中，想要畅享4K高帧率游戏有点吃力，那么RTX40系显卡中，将显得轻而易举。

　　在GeForceRTX 4090这张显卡上，达到了191RT-TFLOPs的处理能力，而RTX30系显卡最快处理能力为78RT-TFLOPs，足足为2.4倍。并且根据NVIDIA的官方说法，第三代RTCore的峰值RT-TFLOPs相比于前代提高了2.8倍。而这只能说明，这张4090并非AdaLovelace架构的最终形态。

　　OpacityMicro-Map Engines

　　在第三代RTCores中引入了两个重要的硬件单元，首先是OpacityMicro-Map Engines，可以理解为微映射透明度引擎，它主要的作用是优化光线追踪渲染，可大幅减轻着色器的工作负担。

　　比如树叶之类的复杂物体，不同的光线都会影响它的表现状态，以及树叶之间的光线反弹，所以对于光线追踪的计算量是巨大的。

　　不过OpacityMicro-MapEngines可以将光线追踪特性烘焙到不透明蒙版中，所以那些不规则形状和半透明的对象，也就能够更快更精准的渲染出来，从而极大减轻着色器的工作负担。

　　DisplacedMicro-Mesh Engines（DMM）

　　DisplacedMicro-Mesh Engines可理解为微网格置换引擎，它构建光线追踪的BVH（Boundingvolume hierarchy）的速度提高了10倍！所使用的的显存减少了20倍！

　　DMM由第三代RTcore本地处理，与前几代相比，它只使用基本三角形渲染复杂几何图形，极大减少了存储和处理需求。

　　具体的工作原理从图中一目了然，新的DMM可以将面数非常多的复杂图形做简化，创造出简单的模型，但整体的光线追踪效果不变。

　　通过一些模型数据我们可以具体看到，新的DMM将模型简化了多少。原本1100万三角面的模型，经过简化后，只有15万左右的微网格，BVH的构建速度提升了8.5倍，小了6.5倍。

　　而这还不是最夸张的，越复杂的模型往往优化的效果越好，在官方展示的这几组对比示例中，最快可提升大于15倍的速度，容量简化20倍的模型。

　　第四代TensorCores

　　除了光追单元的升级外，第四代张量核心的升级更加恐怖。它采用了新的FP8张量引擎，在GeForceRTX 4090这张显卡上，吞吐量达到了1.32Tensor petaFLOPs，提高了5倍。

　　注意这里的单位——petaFLOPs。以往的TFLOPs为万亿次浮点运算，而petaFLOPs则为千万亿次浮点运算。

　　DLSS3

　　本次推出的DLSS3也是RTX40系一大卖点，从DLSS2.3直接迈入了3.0版本，也能看出此次的升级之大。而DLSS3也被NVIDIA官方称为神经网络渲染新时代。

　　全新的DLSS3在原有的DLSS超分辨率的基础上，添加了光学多帧生成技术，以生成全新的帧，而不像原来只能生成像素。

　　DLSS3结合了DLSS超分辨率、DLSS帧生成和NVIDIAReflex这三大技术，能够重建八分之七的像素，极大提高性能。

　　在GPU受限的游戏中，比如2K分辨率及以上的更高分辨率，DLSS2能够将帧率提高2倍，DLSS3则能够提升4倍。

　　本次DLSS3跨越了一个大版本，从想法和原理上也再度升级，完全“猜想”1帧的技术，我们解释起来简单，但实施起来需要大量的推理与演算，以及绝对超前的想法。

　　不过“凭空”生成的1帧，在延迟上绝对要比DLSS2高。所以此次完整的DLSS3中，捆绑了NVIDIAReflex，可以有效帮助减小延迟。

　　这也不负NVIDIA给它起了个“神经网络渲染新时代”的名号。纵观目前市面上的XeSS、FSR技术，DLSS绝对称得上“巨人的肩膀”。当然，连年的创新，苦的是手持上一代显卡的玩家，想体验DLSS3的帧生成，目前唯一的办法就是购入一张RTX40系显卡。

　　NewOptical Flow Accelerator

　　NewOptical Flow Accelerator光流加速器是在第四代TensorCores中最新引入的，这也是为何DLSS3中的帧生成为RTX40系显卡独享。

　　光流加速器在原本DLSS2的基础上，还可以计算两个连续帧内的光流场，能够捕捉游戏画面从第1帧到第2帧的方向和速度，从中捕捉粒子、反射和光照等像素信息。并分别计算运动矢量和光流来获得精准的阴影重建效果。

　　以《赛博朋克2077》为例，在第一帧，光流加速器会捕捉到每一个像素中的粒子、反射和光照等信息。并在第二帧中查找匹配的像素区域，计算帧之间的差值。

　　如果说原来DLSS2能够“猜”出一张图剩下的像素，那么DLSS3除了这些，还能够“猜”出下一帧的画面。

　　另外由于DLSS3的帧生成是在GPU中处理和运行的，所以即使遇到CPU瓶颈的游戏，AI同样能够提升帧率。这也是为什么在此次发布会中说到，DLSS3能够突破CPU的限制来提升帧数。

　　双AV1编码器

　　本次升级的第八代NVENC编码器可以说是直播、视频、后期工作者的极大福音。它首次加入了对AV1编码的支持，最显而易见的效果就是直播。

　　相比传统的H.264编码，AV1编码的效率平均提升了40%，在同码率下AV1编码的画质将更好。目前大部分直播的分辨率和清晰度，均受限于平台规定的最大比特率。以Twitch限制的8Mbps为例，可以看到在同等带宽下，同为2K60帧的画面，采用AV1编码的清晰度明显比H.264更高。

　　说起直播，OBS相信大家都不陌生，在10月份即将发布的补丁中，OBS就加入了对NVENC的AV1编码支持

　　当然，直播只是我们更容易见到的AV1优势，在视频工作的所有环节，AV1编码都可以带来极大提升。

　　所以，如图所见。NVIDIA已经为广大用户铺好了一条完整的生态链，从编码API、软件、平台到播放器，将全面支持AV1编码。

　　另外再说一下NVIDIA一直强调的双AV1编码。顾名思义，即部分显卡内搭载了两个编码器，它所带来的效果也是显而易见的。

　　首先，根据官方宣传的，在4KH.265的导出速度上，RTX4090是RTX3090 Ti的2.2倍；在8KH.265的导出速度上更是达到了2.5倍。这部分的提升，大家常用的剪映同样适用，感兴趣的用户不妨亲自体验一下。

　　除了导出速度，8K60帧的视频录制在以前简直难以想象，而双编码器的好处就是可以将图像一分为二，两个编码器分别处理7680x2160的图像信息，最后拼合完整。

　　关于编码部分，可能大部分用户的感受不深，但当有一天，你想录屏的时候，却发现显卡不支持，才会发觉它的重要性……

　　随着图像逐渐进入到超清时代，硬件编码和渲染几乎已经成为不可或缺的帮手。虽然论质量，硬件编码仍不及CPU软编，但软编做到了极限画质，也要承受时间的无穷长。甚至在一张8K渲染图中，两种编码方式的时间差距就已经达到了几个小时，遑论一段10秒的CG动画。在不断进步的硬件编码中，质量和时间也在不断地被挑战和刷新。

3测试平台简介

　　首先介绍一下测试平台，为了保障耕升GeForceRTX 4090 炫光OC的性能发挥，我们的平台也再次进行了全面更新。不过由于手头上没有旗舰处理器，采用了12代中高端产品，并且在电源上进行了着重升级，采用了华硕ROG雷神2代1600W的钛金牌全模组电源。

　　首先看一下GPU-Z的参数，耕升GeForceRTX 4090 炫光OC采用AD102核心，采用TSMC4nm 定制工艺（TSMC4 nm NVIDIA Custom Process），芯片面积608平方毫米，这里相对于RTX30 系的GA102的628平方毫米更小。

　　拥有16384个CUDA，相比RTX3090 Ti 的10752多52%，Boost频率达到了2580MHz，相比公版的2520MHz有一定的提升。

　　采用24GBGDDR6XMicron显存，位宽为384bit，显存带宽达到了1008.4GB/s，光栅单元和纹理单元为176和512。

4理论性能测试

　　下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装：FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能，取显卡分数实际测试结果如下：

　　在针对显卡DX11性能的3DMARKFS 套装测试中，耕升GeForceRTX 4090 炫光OC的提升非常惊人，可以看到在分辨率越高的情况下这张显卡提升越大，其中FS提升了65%；FSE提升了79%；FSU则暴力提升了82%。

　　综合来看，在整个FS套装的测试中，耕升GeForceRTX 4090 炫光OC相较GeForceRTX 3090 Ti 的提升约为75%。

　　3DMark FireStrike 系列测试是对显卡DX11性能的全面检验，我们可以将FS系列的测试成绩看做是大部分过去流行热门游戏的基准参考，耕升GeForceRTX 4090 炫光OC相比上一代旗舰RTX3090Ti 以及RTX3090 都有着巨幅性能提升。

　　而在针对DX12环境下的TimeSpy 和TimeSpy Extreme 测试中，耕升GeForceRTX 4090 炫光OC相较GeForceRTX 3090 Ti 的提升分别为：TS提升69%；TSE提升77%，综合下来约为73%。

　　3DMarkTime Spy 系列是针对DX12图形接口标准的基准性能测试，能够代表目前以及可预见未来游戏大作的性能表现，耕升GeForceRTX 4090 炫光OC的成绩同样惊人，在考验更为严苛的TSE测试中也有着高达77%的性能提升。

　　PortRoyal是3DMARK中专门针对光追性能的测试项，耕升GeForceRTX 4090 炫光OC相较GeForceRTX 3090 Ti 的提升约为82%。

　　本次测试我们还引入了3DMark最新的SpeedWay性能测试模块，SpeedWay使用光线追踪和实时全局照明来渲染逼真的光照和反射效果。它基于新的DirectX12 旗舰版功能（如网格着色器和可变速率着色）来优化性能和视觉质量，是测试显卡全方位综合性能的基准测试工具。

　　由于这个工具刚刚发布，所以我们暂时没有更多进行其他产品的跑分进行对比，这里的数据供大家参考，耕升GeForceRTX 4090 炫光OC的表现优于其他Boost频率同样为2580MHz的竞品，不过性能差异并不是非常明显。

　　综合来看，耕升GeForceRTX 4090 炫光OC的理论性能相较GeForceRTX 3090 Ti的提升约为77%，表现非常出彩。

　　耕升GeForceRTX 4090 炫光OCDLSS 3 4K

　　在本次测试中，我们使用3DMARK的测试版进行了DLSS3 的相关测试。在4K分辨率下，DLSS关闭为58.43帧，DLSS3 开启后为175.51帧，提升幅度高达200%，这样的性能跨越着实罕见！

　　RTX3090 Ti DLSS 2 4K

　　另外我们也测试了GeForceRTX 3090 Ti 在该程序下成绩，其中DLSS关闭为32.73帧，由于不支持DLSS3，所以在DLSS2 下的成绩为83.63帧。

　　耕升GeForceRTX 4090 炫光OC在开启DLSS3 后，相比关闭提升了200%；而GeForceRTX 3090 Ti 在开启DLSS2 后，相比关闭提升了155%。

　　当然DLSS3最夸张的还不止数字上这么简单，我们再来看看这张图。

　　耕升GeForceRTX 4090 炫光OCDLSS 3 8K

　　在8K（7680x4320）分辨率下的 DLSS3 测试中，耕升GeForceRTX 4090 炫光OC在DLSS关闭的情况下仅有13.43帧，已经无法正常运行游戏，而在开启DLSS3 后，一跃达到了93.68的流畅水准，提升了598%！

　　8K 下的测试成绩意味着耕升GeForceRTX 4090 炫光OC已经可以满足8K@60fps的游戏运行及格线，如果适当降低画质，画面帧率甚至可以突破100Hz，这让现在的8K电视等设备也可以用于游戏需求，为玩家带来更加极致的游戏画面。

5常规游戏性能测试

　　由于本次RTX40 系加入了DLSS3 新技术，所以后面会进行单独测试，这里依然选择主流的几款3A大作进行游戏性能对比。

　　首先在《地平线5》中，可以明显看到，不止在1080p分辨率下，即使在2K分辨率中，受限CPU的情况依然明显。作为一款标准的3A游戏，在4K分辨率下依然可以跑到149帧，这在以前绝对是无法想象的。

　　对于像《地平线5》这样的赛车游戏来说，赛车竞速只是部分玩家体验绝美风景的一种方式，分辨率和刷新率的改善带来的不仅仅是游戏感受的提升，更是玩家对游戏内风土人情的全新体验。

　　性能方面，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分别为：1080p提升52%；2K提升56%；4K提升75%，综合提升61%。

　　在《刺客信条：英灵殿》中，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090Ti 的提升分别为：1080p提升59%；2K提升69%；4K提升67%，综合提升65%。在众生平等《英灵殿》中取得如此巨额的画面帧数改进属实难得，耕升GeForceRTX 4090 炫光OC即便在4K分辨率下也能够获得120fps的帧率表现，远远超过了一些竞品，这非常不容易。

　　在《无主之地3》中，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分别为：1080p提升42%；2K提升68%；4K提升68%，综合提升59%。

　　《光明记忆：无限》的光追测试软件是独立于游戏的测试工具，比游戏中用到的光线追踪技术更多，测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低，但实际游戏配置相当亲民。

　　性能方面，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分别为：1080p提升78%；2K提升81%；4K提升73%，综合提升77%。

　　在另外一款国产游戏《边境》的跑分软件中，情况基本与《光明记忆：无限》相同，测试条件均在“RTX最高/DLSS质量”下进行。

　　在《边境》中，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分别为：1080p提升82%；2K提升90%；4K提升85%，综合提升86%。

　　《光明记忆：无限》和《边境》两款最早的光追测试程序，到今天也已经陪伴着NVIDIA走过了三代光追核心，见证了光线追踪单元从懵懂到成熟的全过程。

　　耕升GeForceRTX 4090 炫光OC的提升是肉眼可见的，从初代只能保证1080P下的流畅运行，到如今在4K分辨率下获得87fps的运行帧率，能够切实感受到NVIDIA的技术“大跃进”。

6DLSS 3性能测试

　　由于本次新技术DLSS3的推出，将有35款游戏将于近期推出全新的DLSS3功能，本次我们也拿到了部分游戏的测试版。

　　另外《超级人类》、《生死轮回》、《逆水寒》“拂云庭“、《微软模拟飞行》、《瘟疫传说：安魂曲》都将在10月陆续发布支持DLSS3 的版本。

　　其中《赛博朋克2077》、《F122》、《瘟疫传说：安魂曲》、《微软模拟飞行》、《逆水寒》本次进行了DLSS3 的测试，另外Unity和虚幻引擎也提供了本次的测试程序。

　　本次DLSS3 的测试图表比较繁琐，并且增加了1%Low FPS 和延迟的测试，普通的FPS好理解，那么这个1%Low FPS 是什么意思。

　　首先，游戏Benchmark通常测试的FPS即为，一段时间内的游戏平均帧。而1%Low FPS 则是将一段时间内的帧数从大到小排列，取最小的1%出来，再对这1%的数求平均值。

　　其实简单来说，这两个数值都不能代表我们在游玩时，具体哪一刻的感受，但FPS更注重整体，而1%Low FPS 则是从最差的里面求平均，更谨慎一些。

　　看懂了1%LowFPS，我们再来看这张图表，在坐标轴左侧的为延迟（越低越好），坐标轴右侧的均为帧数（越高越好），并且由于牵扯到正负坐标，所以两侧的值有可能会不同。

　　Frameview中的测试结果为小数点后三位，为了方便观看，这里在帧数上进行四舍五入，延迟则保留小数点后一位。由于目前测试DLSS3 的游戏均为测试版，所以难免出现BUG。

　　在《微软模拟飞行》中，在开启和关闭DLSS2 的时候，分数几乎无变化。这款游戏是极度吃CPU资源的游戏，如果瓶颈卡在处理器上，那么传统的DLSS2 的确无法提供更多的帧数加成。

　　而在DLSS3 中，我们能够明显看到帧数的大幅提升，要知道我们所有DLSS3 的测试均在4K分辨率下进行。

　　不过帧生成并不是毫无弊端，这也是为什么此次测试加入了延迟。并且在开启DLSS3 后，NVIDIAReflex 是捆绑开启的。但相对于DLSS2 增加的这点延迟，在实际体验中的感受并不强。

　　在《赛博朋克2077》中的数据反映比较真实，可以看到在DLSS关的光线追踪最高的情况下，即便耕升GeForceRTX 4090 炫光OC显卡也只有38帧，并且延迟达到了50.6毫秒。

　　而在开启DLSS3 后，帧数为138，提升了263%。虽然相比DLSS2 的延迟高了11.3毫秒左右，但相比关闭DLSS来说，依然维持在较低的水平。DLSS3 直接将耕升GeForceRTX 4090 炫光OC的运行帧数从及格线拉到了电竞水平，实现了质的飞跃。

　　《瘟疫传说：安魂曲》是最新发布的一款游戏，在DLSS3 和DLSS关之间的帧数提升，同样达到了138%。在这款游戏中，DLSS3 相比DLSS2 的延迟增加了12.1ms，在我们测试过的4090显卡中属于比较低的水平了。

　　目前《F122》的数据测试同样有问题，在DLSS关和DLSS2 中均没有延迟数据。

　　这一组主要看帧数的提升。其中DLSS3 相比DLSS关的帧数提升了147%，相比DLSS2 的提升也达到了23%。赛车游戏的帧数提升虽然不像FPS那样可以提升游戏胜率，但是画面越流畅，真实感就越强，玩家的体验也就越沉浸，DLSS3 给《F122》带来的改善相当巨大。

　　最后则是国产游戏《逆水寒》的光追测试，本次我们选择的测试Demo采用了真正的全局光照。

　　在尝试关闭DLSS运行后，帧数仅有个位数，而延迟早已上万。还记得在纯光线追踪软件中测试的《光明记忆无限》和《边境》，在本次只有DLSS2 的情况下都能够达到80帧左右。而《逆水寒》这款真正意义上的全局光照，在DLSS2 开启后仅有50帧左右，着实恐怖。不过在开启DLSS3 的情况下，4K分辨率也来到了82帧，已经可以保证基本的游戏体验了。

　　画质方面，在上图中我们截取《赛博朋克2077》中的一角，可以看到在两种DLSS模式下，相较原画质几乎没有明显变化，只在栅栏处的光影效果有所不同，但对于如此大幅度的帧数提升，这点瑕疵几乎可以忽略不计。

　　RTX3090 Ti即时帧数39帧

　　耕升GeForceRTX 4090 炫光OC即时帧数101帧

　　在Unity的测试程序中，有一组实时演算的光线追踪+DLSS的帧数对比。耕升GeForceRTX 4090 炫光OC在开启DLSS3 后，实时帧数为101；而GeForceRTX 3090 Ti在开启 DLSS2 后，实时帧数为39帧，提升约为159%。

　　DLSS关81帧

　　DLSS2 160帧

　　DLSS3 195帧

　　在UE5提供的测试游戏中，方便地给出了DLSS的快捷测试，这里分为DLSS关（超分辨率关+帧生成关+Reflex关）；DLSS2（超分辨率性能+帧生成关+Reflex开）；DLSS3（超分辨率性能+帧生成开+Reflex开）三档测试。

　　其中，耕升GeForceRTX 4090 炫光OC在DLSS关的即时帧数为81帧，DLSS2 为160帧，DLSS3 为195帧。不过UE5这个测试的DLSS3 延迟为48.00ms，而DLSS2 为16.85ms，相对较高。

　　从DLSS3 的整体测试中能看到，在开启DLSS3之后画面的延迟都有小幅度的提升，不过在大多数游戏中，这点延迟其实不会造成过多的负面影响，但是其提升的帧率将会实打实地带来更为流畅的画面，孰轻孰重不必多说。

7专业软件测试

　　作为“90”级别的显卡，拥有24GB的超大显存，内容创作者领域的应用是必不可少的。我们使用SPECviewperf13 这款工业、专业软件跑分测试。

　　对比显卡为耕升 GeForceRTX 4090 炫光OC显卡、上一代旗舰GeForceRTX 3090 Ti 显卡以及上一代游戏旗舰GeForceRTX 3080 Ti 显卡。

　　在SPECviewperf13 的软件测试中，每款专业软件对于性能提升的程度不尽相同，其中SW相比RTX3090Ti 提升了34%，MAYA相比RTX3090Ti 提升了42%，CREO相比RTX3090Ti 提升了41%，CATIA相比RTX3090 Ti 提升了56%，3DSMAX 相比RTX3090Ti 提升了54%。

　　耕升GeForceRTX 4090 炫光OC测试得分

　　RTX3090 Ti 测试得分

　　Blender是一款专业的三维渲染软件，本次推出了固定的Benchmark跑分软件，省去了安装软件下载素材的麻烦。这款跑分软件只需下载好启动程序，软件会自动渲染测试monster/junkshop/classroom共三个场景。

　　上图为耕升GeForceRTX 4090 炫光OC显卡得分，分别为6510/2977/3044分，平均4177分；下图为GeForceRTX 3090 Ti 显卡得分，分别为3136/1812/1549分，平均2165分。通过平均分的比较不难发现提升非常明显，达到了93%，这对于以帧为渲染单位的动画来说，能够大幅度节省时间。

　　在专业软件的测试中也可以感受到耕升GeForceRTX 4090 炫光OC的优秀性能表现，虽然相对游戏帧数的提升没有那么夸张，但是对于工作室来说，每一个流程的效率改善都能够加快项目进度，从而快速完成任务，提升人效。

8功耗及温度测试

　　功耗测试中，我们选择FurMark软件进行拷机测试，并采用GPU-Z检测温度，功耗仅计算显卡自身。

　　在本次的烤机测试中，耕升GeForceRTX 4090 炫光OC的表现同样出色，在100%TDP 满载的情况下，功耗来到了450W左右，与公版相当，但对于电源的要求也非常恐怖了，官方建议电源850W，这方面的预算不能节省。

　　另外在满载拷机测试中，耕升GeForceRTX 4090 炫光OC峰值温度为67.2℃，而热点的峰值温度为75.1℃，GPU频率来到了2610MHz，已经突破了标定值2580MHz，这也是它整体性能表现相对于其他竞品来说更好的原因之一。

9诠释最炫RGB显卡

　　AdaLovelace 架构给第三代光追核心增加的两个新引擎OpacityMicro-Map Engines（OMM）和DisplacedMicro-Mesh Engines（DMM）为RTX4090 的光追性能带来的提升令人难以置信，同时DLSS3 更是被NVIDIA官方称为神经网络渲染新时代，光线追踪+神经网络渲染，为NVIDIA在过去几年一直推动的图形技术赋予了更多的想象空间。

　　4K 高刷新的3A大作将不再是通过妥协画面质量才能够获得的，游戏玩家们可以憧憬8K分辨率下的极致虚拟世界，游戏工作室们也能够在新显卡算力的支持下，进一步发挥想象空间，提升游戏画面的真实氛围，为游戏世界带来更多的精彩故事。

　　耕升GeForceRTX 4090 炫光OC圆满诠释了它“最炫RGB显卡”的定位，通过极致的反差感为玩家带来个性化十足的灯光方案，哪怕你不是RGB爱好者，也不得不感叹耕升实在是太会了，把显卡的灯光设计带到了新的高度。

　　同时，耕升GeForceRTX 4090 炫光OC也有着不俗的性能表现，无论是理论性能测试还是游戏性能实测，都有着超越同级竞品的性能表现，可谓是有里有面，有颜值也有实力。综合下来，是一款没有明显短板的RTX4090 显卡，如果你想为自己的RGB机箱增添更多活力，那么耕升GeForceRTX 4090 炫光OC再合适不过了。目前这款显卡已经正式上市销售，感兴趣的朋友不要错过！

THE END

免责声明：本文系转载，版权归原作者所有；刊载之目的为传播更多信息，如内容不适请及时通知我们。

诠释最炫RGB显卡！耕升GeForce RTX 4090 炫光 OC评测

相关热点

最新文章

相关推荐

东京奥运会中国第13金由游泳健将张雨霏斩获，一天斩获两枚金牌

微信显示“正在输入”，其实不是在回复消息，背后原因挺“伤人”

两名航天员成功出舱航天员刘伯明成功开启天和核心舱节点舱出舱舱门

关注我们

诠释最炫RGB显卡！耕升GeForce RTX 4090 炫光 OC评测

相关热点

最新文章

相关推荐

东京奥运会中国第13金由游泳健将张雨霏斩获，一天斩获两枚金牌

微信显示“正在输入”，其实不是在回复消息，背后原因挺“伤人”

两名航天员成功出舱 航天员刘伯明成功开启天和核心舱节点舱出舱舱门

关注我们

两名航天员成功出舱航天员刘伯明成功开启天和核心舱节点舱出舱舱门