在整个RTX 40系显卡中,GeForce RTX 4090被认为是最值得买的型号。无论是基础规格,还是实际展现出来的性能水准,GeForce RTX 4090相对家族中的其它型号而言,都实现了实质性的巨大提升。对于这样一款巅峰级产品,老牌显卡厂商影驰最近推出了全新的影驰20周年GeForce RTX 4090显卡,它是影驰20周年的倾心之作,也是这家老牌显卡厂商与巅峰性能的珠联璧合。因此,无论是在外观设计、做工用料,还是在性能、散热调校方面,这款产品充分展现了影驰深厚的产品设计制造功力。
接下来就让我们通过本篇评测,一起感受一下这款旗舰级新品的魅力吧。
成立于1993年的影驰,整个品牌历史已长达30年之久。而本次推出的影驰20周年GeForce RTX 4090显卡,是为了纪念影驰品牌于2003年正式进军中国市场的扛鼎之作。这20年弹指一挥间,但影驰为中国用户带来的经典产品不胜枚举。“名人堂”、“金属大师”等系列诞生的经典产品,为众多玩家带来了卓越体验。
而这一次,影驰20周年GeForce RTX 4090显卡再次以出色的外观设计,扎实可靠的品质做工,呈现在大众用户面前。
·纯白配色高颜值高品质旗舰卡
影驰20周年GeForce RTX 4090显卡从PCB到卡体外部装甲都采用了纯白设计,对于当下一些追求纯白配色主机的朋友可以说是最佳选择。而且白色本身也是影驰不少经典产品的标志色,放在如此有纪念意义的一款产品上,可以说是一次完美的传承。
显卡前端采用100MM 11扇叶双静音风扇设计,左侧风扇中心蚀刻出了影驰logo,右侧风扇中心蚀刻出特殊的“20”字样,彰显20周年元素。最右侧是背部风扇对应的散热鳍片。
将显卡翻过来之后,就可以看到背部的90mm 11扇叶风扇了。影驰将“20”元素巧妙地与风扇融合起来,构成了极为惹眼的设计感,尤其是风扇右上角的“th”字样,可以说是整个设计的点睛之笔。
背面左侧,则设计了GEFORCE RTX和GALAX的品牌名称。
显卡上方同样以GEFORCE RTX和GALAX 20的元素为主,另外右下角可以看到三条LED灯条,点亮状态下可以呈现炫丽的ARGB背光效果。
此外,卡体右侧边缘也印有“20”字样。所以总体来看,影驰20周年GeForce RTX 4090显卡的设计充分突出了20周年的设计元素,让这款产品更具纪念价值和收藏价值。
视频输出接口方面,这款显卡配置了1个HDMI 2.1和3个DP 1.4a。HDMI 2.1可支持120Hz@4K HDR、60Hz@8K HDR视频输出。
这款产品的供电口设计在了显卡底部右下角的内侧,并随机附赠了一根延长线,这种隐藏式的供电口设计使得整个显卡更加美观,而且在走线方面可以做的更加隐蔽,对于追求隐藏式走线的朋友来说非常合适。
在众多显卡品牌中,影驰产品的设计一直以来都备受用户认可,尤其是对于喜欢白色系配件的朋友来说,影驰显卡往往是首选。这次推出的20周年GeForce RTX 4090显卡,同样拥有出色的颜值、优质的做工,而且还拥有纪念价值和收藏价值,对于硬件发烧友来说是一个非常值得考虑的选择。
那么这款显卡的实际性能如何呢?
·RTX 4090显卡架构技术回顾
在性能测试之前,我们不妨先来回顾一下RTX 4090的技术要点。
首先,RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了恐怖的760亿个晶体管,而在RTX 30系显卡中为280亿个。
与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可达到90-TFLOPS的着色器数据吞吐量,而本次发布的GeForce RTX 4090则达到83-TFLOPs,相比上一代NVIDIA Ampere则只有40-TFOPs。
完整的AD102核心共有18432个CUDA,其中包含12个图形处理集群(GPCs), 72个纹理处理集群(TPCs), 144个流式多处理器(SMs)。144个第三代光追核心(RT Cores)、576个第四代张量核心(Tensor Cores)。
相比完整的GA102来说,RTX 4090共有16384个CUDA,其中包含11个GPC、64个TPC以及128个SM单元,第三代RT Cores为128个,第四代Tensor Cores为512个。
另外NVIDIA官方也特别表明了L2 Cache容量以及最终的等效带宽,这是RTX 40在架构中变化比较大的地方。
我们以两张图来简单说明L2缓存的作用。
如果把GPU内核比作网店店主,那么L1缓存就是在日常工作的屋子中堆放的可发货产品,但由于所有工作都要在这间屋子进行,堆放产品的空间有限;所以大部分产品就需要到L2缓存中,它就好比在工作室隔壁的仓库,虽然需要走出去,但仍然是很近的路程。
如果这个仓库还是放不下,那么只能到更远的显存中去调取产品。当然如果有爆显存的情况,那么这位“店主”可能还要打车去更远的系统内存区调取数据。
这中间的路程和耗费时间就好比GPU额外的工作量,如果绝大部分数据只存放在L2缓存就可以拿到,那么将极大节省功耗。并且由于不再需要频繁调取显存中的数据,所以显存位宽适当降低,对于运行效率也是没有影响的。
在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。
然而,由于L1缓存需要离内核非常近,不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。
如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
这张RTX 4090相比上一代RTX 3090 Ti而言,拥有更大的L2缓存。而增加L2缓存的大小可以提高性能,降低延迟,并提高续航时长,数据访问在GPU上即可完成(否则GPU就要频繁从显存读取数据,过分依赖显存带宽)。所以,这也是为什么在RTX 40系显卡中,位宽带宽普遍偏小的原因。
·测试平台配置信息
基础技术特性回顾之后,来看看本次测试所使用的硬件平台配置。为了确保其性能充分释放,我们采用了目前的旗舰级处理器i9-14900K,同时搭配1600W电源提供充足的电力支持,另外在主板、内存、硬盘方面也都采用了高规格配置。
通过GPU-Z检索我们可以看到影驰20周年GeForce RTX 4090显卡的基本规格,它采用AD102核心打造,TSMC 4N NVIDIA定制工艺,拥有16384个CUDA,相比RTX3090 Ti 的10752多52%,Boost频率达到了2595MHz,相比公版的2520MHz有一定幅度提升。支持24GB GDDR6X显存,位宽为384bit,显存带宽1008.4GB/s,光栅单元和纹理单元为176和512。
·3DMark理论性能测试
基本规格了解之后,下面我们看看这款显卡的3DMark理论性能表现。
首先是3DMark Fire Strike的DX11性能测试。三档跑分如下:
影驰20周年GeForce RTX 4090显卡在性能调校方面还是相当不错的,全面超过了公版RTX 4090的表现。FireStrike模式评分76528,FireStrike E模式评分44078,FireStrike U模式评分24814分, 相对公版RTX 4090而言,DX11整体性能都要更好一些。
3DMark Time Spy DX12测试项,普通模式评分36365分,E模式评分19139分,相对DX11模式较小的优势来说,影驰20周年GeForce RTX 4090显卡在DX12性能方面比公版要强很多,所以玩DX12游戏的话,会获得更好的性能加持。
PortRoyal光追性能方面,影驰20周年GeForce RTX 4090显卡评分达到了25657分,相对公版RTX 4090领先14%,强悍的DX12性能为最终的光追表现奠定了基础。
Speed Way是DirectX12 Ultimate的专业测试项,因此要求显卡必须支持DirectX12 Ultimate特性,而且显存要达到6GB及以上。在4K分辨率下,影驰20周年GeForce RTX 4090显卡评分高达9858分,表现还是比较不错的。
最后一项理论测试,我们来看看DLSS的表现。4K分辨率关闭DLSS时,平均帧率仅为57.98fps,但是开启DLSS之后,可以达到175.01fps,提升幅度达到了202%,效果显著。不过其实对于RTX 4090这个等级的显卡来说,目前市面上的游戏里,大多数在开启光追的情况下是无需开DLSS的,帧数足以满足流畅游戏需求。从这个角度来说,DLSS在现阶段还是更适合入门和中端级别的显卡。
·常规游戏性能测试
RTX 4090作为目前显卡中的天花板,玩游戏自然是小菜一碟。从理论测试来看,影驰20周年GeForce RTX 4090显卡整体性能是相当可靠的,所以玩起时下各类游戏来说,4K分辨率、最高画质没有任何问题,想要获得极致游戏体验就选RTX 4090。
那么接下来咱们看看常规游戏测试中,影驰20周年GeForce RTX 4090显卡的表现。考虑到它的性能,我们就不在1080p分辨率下测试了,直接上2K和4K成绩。
《极限竞速:地平线5》作为一款竞速类游戏,画面制作精良,而且硬件优化水平极佳。影驰20周年GeForce RTX 4090显卡加上酷睿i9-14900K这样的顶级硬件组合,4K分辨率平均帧数就已经达到了136fps,2K直接飙升到177fps,流畅运行没有任何压力。
《无主之地3》看似是漫画渲染的画面,但其实对硬件要求是相当高的。不过影驰20周年GeForce RTX 4090显卡拿下这款游戏没啥问题,4K分辨率平均129fps,2K分辨率平均224fps,流畅运行无压力。
《刺客信条》系列最近几代的引擎都一样,所以画质表现没有特别大的差异。我们参考了《刺客信条:英灵殿》的性能评分,4K分辨率平均116fps,2K分辨率平均144fps,这可能是因为2K分辨率GPU负载变低之后,游戏本身调用GPU不够充足,所以帧数反倒低了一些,但是4K分辨率下的成绩证明在应对高负载任务时,影驰20周年GeForce RTX 4090显卡相当可靠。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。所以测试帧数相对实际游戏是会低一些,这里只做参考就好。
实测下来,影驰20周年GeForce RTX 4090显卡的发挥是相当稳定的,4K分辨率平均74fps,2K分辨率平均134fps,流畅运行没有任何问题。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。影驰20周年GeForce RTX 4090显卡4K分辨率平均帧数88fps,2K分辨率平均帧数151fps,表现同样比公版RTX 4090更加出色。
此外我们还测试了一些其它游戏,包括《永劫无间》、《古墓丽影:暗影》、《荒野大镖客2》以及《地平线:零之曙光》,均是在最高特效下运行的。所有游戏的4K分辨率平均帧数都在80fps以上,2K分辨率平均帧数超过100fps以上,没有任何运行压力。
·全局光照+DLSS3.5测试
当下对于显卡而言,最大的挑战就是全局光照了,开启之后一般显卡真的是顶不住,就连RTX 4080这种等级的产品,在4K分辨率下都比较捉急。只有RTX 4090这种旗舰级才能应对如此高负载的任务。
目前《赛博朋克2077》增加了全局光照模式,并且对DLSS3.5进行了支持。虽然相对DLSS3而言,DLSS3.5没有在帧数提升上有大变化,但是对于光影的精准计算,DLSS3.5可谓是一枝独秀。
以往,开启光追之后,因为画面帧数不高,必须要结合DLSS来提升帧数,以便给玩家更加流畅的体验。但是DLSS开启之后,画面效果又会有一定程度的下降。而DLSS3.5着重解决了这个问题。
下面我们来看看《赛博朋克2077》的全局光照测试情况,以及不同DLSS等级下画面的帧率表现。
4K分辨率,全局光照模式下,开启DLSS3.5,也就是光线重构,游戏平均帧数为74.38fps,流畅游玩是没啥问题的。
如果想要获得更好的帧数体验,大家还可以开启“帧生成”,也就是DLSS Frame Generation。开启之后,在DLSS质量模式下,平均帧数可以达到80.84fps。
平衡模式提升到95.29fps。
性能模式提升到111.95fps。
而超级性能模式下,帧数可以达到150.1fps。
不过如果大家追求极致画质的同时需要流畅画面的话,只需要开启全局光照和DLSS3.5即可。影驰20周年GeForce RTX 4090显卡运行起来是没有任何问题的。
那么DLSS3.5开启之后的实际效果如何呢?注意看下图。
除了与RTX OFF对比外,可以注意上方广告牌的字体,在RTX ON/DLSS OFF中,会有模糊和显示不全的问题,但开启DLSS 3.5后明显清晰了很多。
同样的情况在反射中也相当明显,可以看到地上水坑中的广告牌倒影,在未开启DLSS 3.5时难以分辨,而开启DLSS 3.5字体的边缘更清晰。
下面图片中的场景更加明显,无论是上方的广告牌还是店铺中的霓虹灯,开启DLSS 3.5后都更加清晰了。
因此,DLSS3.5的主要目的不是在于进一步提升帧数,而是改善DLSS开启后的画质下降问题,从而让光追效果得到更好的保留。DLSS3.5通过引入Ray Reconstruction(光线重构)这样的AI模型,将需要人工设计的降噪器,替换为NVIDIA超算训练的AI网络,有效提升了DLSS开启后光线追踪的图像质量。
·功耗与渲染性能测试
接下来我们再看看影驰20周年GeForce RTX 4090显卡的功耗、散热以及渲染性能的表现。
首先在功耗与散热方面,在26℃室温下,Furmark GPU单烤机功耗397W,温度为72.7℃。
这款显卡采用了20周年专属的∞散热系统设计。前方配置双100MM形20周年专属风扇,背部90MM环形风扇进行散热。内部采用4×Φ8mm加4×Φ6mm热管模组,且配有大面积液冷均热板辅助散热,同时显卡的前后面板均采用铝合金材质,坚固耐用的同时,可以有效带动热量传导至背板,提升散热效率。因此在满负载状态下,影驰20周年GeForce RTX 4090显卡的散热表现也是相当靠谱。
渲染性能方面,我们主要参考Blender Benchmark以及V-Ray Benchmark的测试情况,Blender和V-Ray都是行业内知名的渲染器,下面我们看看影驰20周年GeForce RTX 4090显卡的表现究竟如何?
Blender Benchmark测试标准下,三大场景monster、junkshop以及classroom分别得分6693、3110以及2841分,毋庸置疑是目前天花板级别的表现。如果想要获得高效的渲染能力,那么选择影驰20周年GeForce RTX 4090显卡绝对没错。
V-Ray Benchmark测试标准,GPU CUDA加速性能得分3930 vpaths,GPU RTX光追性能评分高达5339 vrays,可以说是最为顶尖的渲染平台。
·AI性能评估与实际体验
对于RTX 4090这个级别的显卡来说,游戏、渲染其实是比较轻度的应用了。真正重度的应用还是要看AI生成和相关模型训练。所以评测的最后,我们看看影驰20周年GeForce RTX 4090显卡在AI方面的表现究竟如何?
首先参考UL Procyon的AI性能理论测试,这里我们选择NVIDIA TensorRT下的Float 32和Float 16浮点运算,通过测试可以看到,影驰20周年GeForce RTX 4090显卡得分分别达到了1943分和3501分,AI性能表现卓越。
此外我们还使用Stable Diffusion进行了图片生成实测,它可以借助N卡的CUDA加速提升效率。这里选用了一长一短两套提示词进行测试,每次生成10张图片。实测短提示词生成10张图片时间为9.82秒,长提示词生成10张图片时间为15.64秒,整体效率可以说是相当出色。
·评测总结
通过一系列的测试可以看到,影驰20周年GeForce RTX 4090显卡自身的性能调校相比公版RTX 4090要好不少,同时通过高效的散热系统设计,使自身能够在100%满负载状态下获得极为优秀的散热表现、功耗释放以及性能输出,对于追求极致体验的游戏玩家、追求高效体验的生产力用户来说,这是一款非常值得选购的产品。
此外不得不说,影驰20周年GeForce RTX 4090显卡的外观设计很容易吸引到用户的关注,作为一款颇具纪念意义的产品,它在整体设计、做工用料方面达到了顶尖水准。同时,隐藏式的供电口设计可以给侧透机箱或海景房机箱带来更好的走线方案,可以让显卡供电线缆完全隐藏起来。
总体来说,影驰20周年GeForce RTX 4090显卡是一款性能强悍,设计做工出众,且极具收藏意义的产品,喜欢白色系配件,亦或者对于硬件有极致追求的朋友不容错过!
此外,影驰还推出了内存与固态硬盘产品线的20周年纪念版产品,包括影驰星曜20周年纪念版内存、影驰HOF EXTREME 50s 20周年纪念版SSD、影驰星曜 20周年纪念版SSD。颜值出众,情怀拉满。感兴趣的玩家也可以关注一下!