【IT之家评测室】NVIDIA GeForce RTX 4070 SUPER 首发评测:征服 2K 高刷屏,AI 性能出色

今年的 CES2024 上,NVIDIA 发布了很多 AI 相关的产品,包括 RTX 40 SUPER 系列显卡。本次我们测试的 GEFORCE RTX 4070 SUPER,按照 NVIDA 的定位,RTX 4070 SUPER 是目前非常适合 2K 高刷游戏的消费级显卡,并拥有一定的 AI 计算能力。那么,这张卡的表现究竟如何呢?接下来就跟着一起看看吧。

为了发挥显卡的最大性能潜力,此次测试我们继续将配置全部拉满,确保其它硬件能够充分帮助显卡释放出应有的性能表现。那具体配置如下:

外观设计

公版产品非常考验厂商的工业设计能力,因为它不仅为其它合作厂商打造了一个性能模板,也必须彰显出产品与众不同的气质、品质感,别家可以做出或简约或炫酷的外观设计来讨好不同的消费群体,但公版设计一定要大气和高级。

开箱这张卡的时候,虽然它的外形和 RTX 4070 基本没有区别,但配色却给了我们一些小小的震撼。长久以来做黑色卡的厂商不在少数,但做得高级并非易事。公版卡的设计相信是长在大多数用户审美点上的,纯黑卡面搭配深空灰抛光质感的金属装饰轮廓,非常深邃和神秘。

GeForce RTX 4070 SUPER 的 TGP 功耗为 220W,由于功耗提升很小,供电接口依旧是定制 16 Pin 的 ATX 3.0 规格,包装内附赠了 1 条 12 Pin 转 2 个 8 Pin 的 12VHPWR 转接线。

为了配合配色和风格的变化,显卡正面左侧的 GEFORCE RTX 4070 SUPER 产品型号标志不再采用亮面白色处理,而是改为了蚀刻纹理,有凹也有凸,更显精致。2 槽设计和 24cm 卡身与上代保持一致,机箱兼容性依旧出色。

X 型的设计和铝合金质感的包边,无不彰显着公版的精致感。拿在手上比较粘指纹,似乎是在告诉用户开箱必须戴手套,仪式感拉满。

厚实的散热鳍片和右侧显眼的风扇均采用全黑化处理,全金属拿在手里很有分量,也有利于更高效地散热。

显卡风扇采用一左一右一上一下的独特排布方式,能形成垂直风道,更好地带走鳍片上的热量。

从侧面看,这代金属包边与显卡整体保持了同色系搭配,GeForce RTX 的 Logo 也黑得更加彻底,一体性大大提升。

除了输出接口的金属挡板,卡身唯一外露的两颗螺丝被放在了右侧,装在机箱里基本看不到它的存在。

供电接口上,选择它最好使用支持 ATX3.0 规范的电源,一根扁平定制线可以大大增强装机的美观性。

另一侧的“金手指”依旧醒目,虽然还是 PCIe4.0 接口,但主流主板都能完美发挥它的全部性能。

I / O 接口挡板采用深灰配色,接口方面配备了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 输出。

核心解析

GEFORCE RTX 4070 SUPER 这次依旧是基于 AD104 核心所打造,具体型号为 AD104-350。内部包含 7168 个 CUDA 核心,相比 RTX 4070 的 5888 个核心数提升了 22%。另外还有 224 个 Tensor 核心、56 个第三代 RT 核心和 80 个 ROP 单元。整体规格上离 RTX 4070Ti 又更近了一步。不过,在第八代 NVIDIA 编码器(NVENC)的数量上依旧只保留了一个,这点比较遗憾。

在显存方面,GEFORCE RTX 4070 SUPER 继续采用和 RTX 4070 相同的 12GB GDDR6X 大容量显存,192-bit 显存位宽,基础频率由 RTX 4070 的 1920MHz 提升到了 1980MHz,加速频率还是 2475MHz 保持不变。从显卡规格和官方的定位上看,GEFORCE RTX 4070 SUPER 是一张定位 2K 高帧率游戏的中高端显卡。

当然,GeForce RTX 4070 SUPER 依旧采用了最新的 NVIDIA Ada 架构,基于 TSMC 4N NVIDIA 定制工艺打造,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器的吞吐量超过上一代产品 2 倍。第三代 RT Cores 的 DLSS 3 可让光追性能提升 2 倍,第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,DLSS 至多提升 4 倍性能。

理论性能

之前推出的 RTX 4070 以 200W 的功耗给广大玩家来了点小小的震撼,那这次 GEFORCE RTX 4070 SUPER 的表现又将如何呢?通过单烤天天圏测试可以看到,在烤机 20 分钟以后,GPU 功耗保持在 220W 左右,核心温度稳定在 72℃左右,显存温度更低只有 68℃。理论上搭配 i5、R5 等百瓦功耗的 CPU,600W 的电源就足以带动,供电线也还是 8Pin 转 1 分 2,玩家一步到位升级显卡基本不需要花费额外的成本更换其它硬件。

烤机之后,我们又对 GEFORCE RTX 4070 SUPER 进行了 3D Mark 的 Time Spy 压力测试,来看看在连续高负载下的显卡性能释放是否平稳和持久,最终 GeForce RTX 4070 SUPER 得到了 99.5% 的成绩,持续的性能输出表现非常出色。

接下来是 GPU 理论性能测试环节,在 3DMark TimeSpy DX12 测试中,GEFORCE RTX 4070 SUPER 的显卡分数为 20563 分,相比 RTX 3070 的公版成绩 13630 分提升了 50.8% 左右,甚至打平了上一代 RTX 3090,但功耗却少了 130W。

在 3DMark TimeSpy Extreme DX12 测试中,GEFORCE RTX 4070 SUPER 的显卡分数为 9970 分,相较 RTX 3070 提升了 3300 分,提升幅度约 49.4%,相比 RTX 3090 的 10328 分也基本追平,而 RTX 4070 的分数可是要略逊于 RTX 3080 的,提升比较可观。

在 3DMark Fire Strike DX11 测试中,GeForce RTX 4070 SUPER 的显卡分数为 45833 分,对比 RTX 3070 的 34363 分提升了约 33.3%,而相比上代 RTX 3090 的 45900 分,相差只有约 0.1%。

在 3DMark Fire Strike Extreme DX11 测试中,GeForce RTX 4070 SUPER 的显卡分数达到了 22899 分,对比 RTX 3070 的 16680 分提升了约 37.2%,而相比上代 RTX 3090 的 23557 分,也仅相差约 2%。

而在 3DMark Portal Royal 光追测试中,GeForce RTX 4070 SUPER 获得了 12595 分,相比 RTX 3070 的 8321 分提升了 51.3%,足以畅玩 2K 分辨率下的光追游戏。

游戏实测

既然说到游戏,就不得不提一下目前 NVIDIA 平台已经拥有超 500 款支持 RTX 技术的游戏和应用,而且随着 DLSS 3 技术的日趋成熟和普及,支持 DLSS 3 的游戏数量也在源源不断地上升。

比如今年 14 款支持 DLSS 3 技术的全新游戏加入,包括《龙之信条 2》《地平线:西之绝境》《如龙 8》《半条命 2 RTX》等知名游戏。另外,已经发布的《心灵杀手 2》《赛博朋克 2077:往日之影》《使命召唤:现代战争 3》等,也在第一时间就支持了 DLSS 3 或 DLSS 3.5 的技术。与此同时,目前主流的热门在线竞技类游戏,都支持了 NVIDIA Reflex 技术,不管是对于低配玩家还是电竞玩家,这两项技术都能极大提升游戏体验。

接下来的游戏测试环节,我们将给大家测试 6 款游戏,包括 2 款在线竞技类游戏,2 款传统光栅游戏以及 2 款支持 DLSS 3/3.5 的光追游戏,并且会在 1080P 和 2K 两种分辨率下进行,确保大家能够直观参考我们的数据。

首先是两款在线竞技类游戏,在《CS2》中我们采用默认高画质选项,分别在 1080P 和 2K 分辨率下进行一局对战,并通过 Frame View 记录平均帧数,最终 GeForce RTX 4070 SUPER 的平均帧数分别是 301 帧和 334 帧。

与此同时,我们还打开了游戏设置中的 NVIDIA Reflex 选项至开启 + 增强,实测其 1080 分辨率下平均延迟为 6.3ms,2K 分辨率下延迟也仅为 9.1ms,这样的延迟表现,应该不会影响大多数玩家的发挥。

第二款在线竞技类游戏我们选择了人气颇高的《彩虹六号:围攻》,GeForce RTX 4070 SUPER 在 1080P 分辨率,最高画质下的平均帧数达到了 466 帧,2K 分辨率最高画质也有 370 帧,即使你用的是 360Hz 高刷的电竞显示器,也完全能够喂饱。

《彩虹六号:围攻》同样支持 NVIDIA Reflex 技术,在游戏运行时选择带有 Vukan 的选项,就能在游戏中找到 Reflex on + 增强的选项,开启之后通过 Frame 进行抓取,最终 1080P 分辨率下的平均延迟仅有 5.7ms,2K 分辨率下为 10.1ms,延迟表现也非常出色。

接着是 2 款传统光栅游戏,在经典动作冒险游戏《古墓丽影:暗影》中,选择最高画质,在不开启光追和 DLSS 2 选项的情况下,1080P 分辨率的平均帧数可达 241 帧,RTX 4070 为 223 帧,提升了 8%; 随后我们开启超高光追等级,DLSS 2 选择质量档,也可以达到平均 193 帧,RTX 4070 为 176 帧,提升了 9%。

2K 分辨率下再次测试两遍,不开光追和 DLSS 时平均 214 帧,RTX 4070 为 201 帧,提升约 6%; 开启光追 + DLSS 质量档时平均 175 帧,RTX 4070 为 153 帧,提升约 14%。

我们还给大家测试了育碧家的最新作《刺客信条:幻景》,众所周知此前发布的神话三部曲对 PC 性能的要求是很高的,而在最新作中选择 1080P 分辨率最高画质,运行游戏自带的性能基准测试,其平均帧数来到了 153 帧,RTX 4070 的平均帧数为 123 帧,提升了约 24%。

来到 2K 分辨率下,GeForce RTX 4070 SUPER 表现得依旧不错,平均帧数正好在 120 帧这样一个高刷甜蜜点上,RTX 4070 的平均帧数则是 97 帧,提升了约 23.7%。看样子《刺客信条:幻景》这一作对 PC 性能的要求更加友好,GeForce RTX 4070 SUPER 完美实现电竞单机体验。

最后是两款支持 DLSS 3/3.5 的光追游戏,其中一款是优化非常出色的《极限竞速:地平线 5》,在游戏中选择极高画质预设,并开启 DLSS 3 选项后,NVIDIA Reflex 选项也会默认打开,我们照例选择 Reflex ON+BOOST,运行游戏自带的性能基准测试。

在 1080P 分辨率极高画质下,DLSS 2 选择质量档,同时开启 DLSS 3 帧生成,GeForce RTX 4070 SUPER 的平均帧数突破 200 帧,来到了 207 帧,同时平均延迟为 16.6ms。RTX 4070 的平均帧数为 200 帧,提升约 3.5%。

即使拉到 2K 分辨率下,平均帧数也有 171 帧,游戏的平均延迟增加到 17.4ms。RTX 4070 的平均帧数是 160 帧,提升约 6%。对于一款带有竞技属性的赛车游戏来说,GeForce RTX 4070 SUPER 这个表现玩起来毫无压力。

而在第一时间跟进 DLSS 3.5 技术的《赛博朋克:2077》中,我们一步到位选择超速光追画质,开启 DLSS 质量档 + DLSS 3.5,此时在 1080P 分辨率下运行游戏自带的基准性能测试,最终平均帧率能到 121 帧,RTX 4070 平均帧数为 104 帧,提升约 16.3%。

不过在 2K 分辨率下,保持其它设置不变,GeForce RTX 4070 SUPER 的平均帧数为 81 帧,RTX 4070 的平均帧数为 78 帧,提升约 3%,这个提升幅度就很小了。

关闭光线重构

开启光线重构

那么 DLSS 3.5 对于游戏画质特别是光追表现上是否有影响呢?大家看这两张图,游戏中同一个场景下雨后湿滑路面的倒影给了我们答案,在开启光线重构后倒影的清晰度提升明显,以往画面中常有的伪影也少了很多,显而易见 DLSS 3.5 可以说是高等级光追的润滑剂,在保留最高画面效果的同时,也能发挥最好的帧数表现。

创意生产

显存规模 GeForce RTX 4070 SUPER 继续保持了 12GB 的大显存,显存类型也依旧是 GDDR6X,显存位宽还是 192 位,这为 GEFORCE RTX 4070 SUPER 的创意生产能力奠定了一定的基础。用户还可通过安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意应用,如 Optix、DLSS 和 Maxine,还有 NVIDIA Studio 全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。同时大显存的加持也让它具备了一定的生成式人工智能的运算能力,拿来进行简单的 AI 绘画训练也是没有问题的。

在建模和渲染类软件中,GeForce RTX 4070 SUPER 的 7168 个 CUDA 核心可以提供硬件加速,使得工作效率得以提高。几乎所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光线追踪功能,实现高性能的最终帧渲染。此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,提供更加流畅的工作体验。

说了这么多,还是让我们来看一下 GeForce RTX 4070 SUPER 的实测表现好了。在建模软件方面,我们测试了 V-Ray Benchmark 的性能表现。其中 GPU CUDA 测试项目得分为 2224 分。

在 GPU RTX 的测试项目中,GeForce RTX 4070 SUPER 最终成绩为 3070 分。

在另一款建模软件 blender 的 Benchmark 测试中,GeForce RTX 4070 SUPER 的三场景得分如图所示,而 RTX 4070 的三场景得分则是 3139,1517,1538,同样都有提升。

接着咱们看看它在视频渲染和编解码方面的性能表现,GEFORCE RTX 4070 SUPER 配备了 NVENC 编码器,且支持新一代 AV1 视频编码技术,相同视频大小下能够提供更加快速的视频编码和更高质量的流媒体传输性能。国内的剪映专业版已经实现了对 NVIDIA AV1 视频编码器的加速支持,我们也对此进行了测试,在剪映专业版中导入一段时长为 2 分 30 秒的 4K 视频素材,然后分别采用 H.264 编码和 AV1 编码进行导出。

可以看到 AV1 编码导出的视频大小为 334MB,H.264 编码导出的视频大小为 790MB,前者对空间的占有连后者的一半都不到,编码效率还是很高的。

而且在画质方面,通过截取两个视频的画面细节进行观察,两种编码方式也基本看不出任何区别,又小又高清,AV1 势必会成为编码格式中的新宠。

还有就是 RTX 视频超分辨率技术,它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现以算法提高清晰度的效果。我们只需在 NVIDIA 控制面板中找到视频 —— 调整视频图像设置,便可以自定义调节,超分等级有 4 档。

↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4

我们通过播放在B站账号发布的一条视频,并将分辨率调整为 480P,然后依次提升超分等级进行截图测试,能看出 1-4 档下人物变得更加清晰了。

实际的视频编辑和渲染性能,我们照例通过 Puget for Adobe 系列插件进行测试,目前该插件推出了一个基于最新版 Photoshop 和 Premiere Pro 的更新,但由于某些原因我们未能完成测试,所以还是用旧版插件进行,跑分仅供大家参考。在 Puget for Premiere Pro 的测试中,GeForce RTX 4070 SUPER 的成绩为 1509 分。

在 Puget for After Effects 的测试中,GeForce RTX 4070 SUPER 的成绩为 1669 分。

最后我们还通过 Stable Diffusion 简单测试了一下这张卡在 AIGC 方面的表现,通过选择模型 v2-1_768-ema-pruned.ckpt,以文生图的方式绘制 21 张 AI 老黄的图像,图像分辨率为 768*768,最终花费 1 分 4.9 秒完成,作为参考 RTX 3070 需要整整 3 分钟才能完成绘制,速度提升了约 65%。

随着 AIGC 领域二创内容的流行和井喷式增加,即使是普通消费者也能借助 Stable Diffusion 这样的创作软件和 RTX 40 系显卡强大的 AI 算力,创作出属于自己的 AI 绘图作品。毫无疑问,在这方面目前 NVIDIA 无论是技术力还是相关应用的适配上,都处于引领行业的地位,而在价格上 GeForce RTX 4070 SUPER 相比专业卡显然在成本上最为划算,且兼顾游戏体验和其它专业生产力创作,非常适合普通消费者体验 AI。

总结

在这个 AI 驱动高新技术产业快速发展的时代,这张公版 GeForce RTX 4070 SUPER 显卡自然不能算作是单纯的升级产品,就本身定位而言,它的性能赶超了上一代 RTX 3090,功耗却只有前者一半,是目前体验 2K 高刷游戏最合适的选择。所以它很适合还在用 RTX 20/30 系列显卡的用户升级,可以大大提升游戏、生产力的性能和体验。

另一方面,GeForce RTX 4070 SUPER 也是当下最划算的 AIGC 创意生产卡,它拥有 568 TOPS 的 AI 算力,相比 RTX 4070 更是多出了 22% 的 CUDA 核心数量,我们从它身上看到了 AI 技术加持下,PC 图形性能的各种可能、突破和未来。如果你是对 AI 创作或计算有一定需求的用户,但预算不是太高,GEFORCE RTX 4070 SUPER 应该也会是你的心头好。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平