尽享极致游戏体验! 索泰GeForce RTX 4090 D TRINITY显卡评测

在众所周知的原因推动下,想要以理想的价格买到GeForce RTX 4090已然不太现实,所幸黄氏刀法着实精准,用GeForce RTX 4090 D实现了合规与性能之间的新平衡点。并且由于没有Founders Edition版本,国内发售的重任落到了几家AIC品牌上,作为NVIDIA好基友的索泰自然是其中之一。

手握GeForce RTX 4090 D GPU的索泰自然不会闲着,索泰GeForce RTX 4090 D PGF、索泰GeForce RTX 4090 D AMP AIRO、索泰GeForce RTX 4090 D天启、索泰GeForce RTX 4090 D TRINITY 月白上齐一套,其中索泰GeForce RTX 4090 D TRINITY 月白不仅上架电商,在众友商定价中,也是颇具性价比的一款。

那么GeForce RTX 4090 D的表现究竟如何?评测就此奉上。

AD102的新篇章

与GeForce RTX 4090所使用的AD102-300-A1不同,索泰GeForce RTX 4090 D TRINITY 月白采用的GPU型号为AD102-250-A1。两款GPU均源自相同的AD102,并以此为基础向下屏蔽单元,实现不同的性能定位。

从整体上看,完整的AD102包含了12个图形处理集群(Graphics Processing Clusters,GPC),72个纹理处理簇(Texture Processing Clusters,TPC),144个流式多处理器(Streaming Multiprocessors,SM),以及搭配了12个32-bit控制器的显存接口,共计384-bit。

同时每个GPC独立使用1个光栅引擎(Raster Engine,RE),6个TPC,2个光栅处理分区(Raster Operations partitions)。其中每个光栅处理分区包含8个光栅处理单元(Raster Operations,ROP),因此总共16个ROP。

每个TPC下包含2个流式多处理器(Streaming Multiprocessors,SM)。从Maxwell架构开始,SM之下细分出了处理块(Sub-Core)概念,AD102中每个SM包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个Warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。包含16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core,因此共计32个CUDA。

此外每个SM还包含1个第三代RT Core,4个第四代Tensor Core,4个纹理单元(Texture Units),256KB寄存器堆,以及可根据需求进行配置的128KB L1共享缓存。

有意思的是,你会发现无论GeForce RTX 4090还是GeForce RTX 4090 D其实都没有用到完整的AD102核心,而是通过禁用GPC或者TPC的数量从而实现不同的定位。而GeForce RTX 4090 D相当于在GeForce RTX 4090的基础上再屏蔽1组GPC实现。

因此索泰GeForce RTX 4090 D TRINITY 月白总共包含57个TPC,114个SM,14592个CUDA Core,456个第四代Tensor Core,114个第三代RT Core。大致对比如下:

可以看到在显存配置和GPU频率上,GeForce RTX 4090 D没有做出删减,同样保持了24GB GDDR6X 384-bit显存,等效21Gbps频率,1008GB/s的显存带宽。另外L2缓存容量也维持在了72MB,GPU频率2.52GHz。大容量显存和L2缓存的配置,都仍然能够给后续的游戏,特别是AI加速性能提供优秀的基础。

在72MB超大L2缓存的加持下,第三代RT Core和第四代Tenor Core作为提升游戏特效性能的主力也有了更多的用武之地。其中,第三代RT Core不仅可以通过L2缓存在路径追踪从中获得巨大收益,本身相对第二代RT Core也提升了射线/三角形求交测试吞吐量,并引入透明度微图引擎(Opacity Micro-Map,OMM)和位移式微型网面引擎(Displaced Micro-Mesh,DMM)。

第四代Tenor Core则是当下火热的DLSS 3以及开始普及的DLSS 3.5的重要组成部分。这是一套利用光流加速器实现像素级的测量,并通过云端的夜以继日的寻找提升高质量图像的途径,这使得GPU摆脱了渲染重建高分辨率方法,让渲染工作大幅度减少,以两帧为例,DLSS 3会承担起第一帧的3/4的工作和第二帧的所有工作,实际上GPU只需要完成其中的1/8的渲染即可,从而节省了大量的计算资源。

而接下来的DLSS 3.5则能同时包含DLSS帧生成(FG)与光线重建(RR, Ray Reconstruction)技术搭配,再加上超分辨率(Super Resolution)、DLAA、帧生成(Frame Generation)多种技术融合。最终构建出一套高效的运行方式,但所有的前提都依靠第四代Tenor Core和光流加速器配合实现的。

此外,索泰GeForce RTX 4090 D TRINITY 月白还包括第八代NVENC和第五代NVDEC编解码器对媒体提供支持,从而在诸如AV1编解码加速上获得更好的体验。

全副武装的TRINITY

让我们把焦点放回显卡本身,索泰GeForce RTX 4090 D TRINITY提供了月白和黑色两种颜色可选,在散热上主要选择了IceStorm 3.0散热系统,优化了空气散热效能,并支持SPECTRA 2.0 ARGB灯效。

其中IceStorm 3.0散热系统提升了散热效能,提供了3个110mm的盾鳞2.0风扇,在提升扇叶面积的同时,也优化了每一片扇叶的曲率和鳞状仿生条纹,从而实现提升风扇风量、风压和风流的效果。

上一页12 3 4 5 下一页 阅读全文

Published by

风君子

独自遨游何稽首 揭天掀地慰生平