一、前言:性价比爆棚的GeForce RTX 40 SUPER系列显卡
新一代的Ada Lovelace架构带来了令人咋舌的能效比,RTX 40系列显卡在性能相同的情况下,功耗只有上代一半甚至更低,只是价格并不是那么亲民。
2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型号。
其中RTX 4070 SUPER以4899元的售价提供了接近于RTX 4070 Ti的性能;
而RTX 4070 Ti SUPER售价与RTX 4070 Ti同为6499元,但性能与9499元的RTX 4080相差无几;
至于RTX 4080 SUPER,它在规格大幅度提升的情况下,将售价降到了8099元,比起RTX 4080足足便宜了1400元。
新一代RTX 40系列SUPER GPU的到来,瞬间让NVIDIA显卡性价比爆棚!
完整的AD104核心
RTX 4070 SUPER使用了与RTX 4070(Ti)相同的AD104核心。
完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代Tensor Core张量核心、60个第三代RT Core光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。
AD104-350核心(RTX 4070 SUPER)
RTX 4070 SUPER做了部分精简,依然是5组GPC,只是将其中2组中的6个TPC减到了5个,也就是5组GPC、28个TPC、7168个流处理器、228个Tensor Core、56个RT Core、80个ROP单元、36MB二级缓存。
除了二级缓存之外,其他规格削减不到7%,而显存规格维持不变,可以想象,它的性能会非常接近RTX 4070 Ti。
RTX 4070 SUPER的详细规格参数如下:
二、图赏:与RTX 4070长一样 6+3相供电电路
包装盒和RTX 4070公版差不多,区别在于原来是白字,现在改成了黑色字体。
开箱。
附赠一条2x8Pin转16Pin的电源线。
上面是RTX 4070 SUPER,下面是RTX 4070,长相也几乎一模一样,差别在于4070的金属条是银灰色,4070 SUPER是深黑色,而且还能反光。
背面。
依然是16Pin供电接口,不过功耗很低,完全不用担心烧化接口的情况。
3个DP1.4和1个HDMI 2.1接口。
没有用均热板,和RTX 4070一样,都是铜底+热管的散热设计。
依旧是RTX 4070的PCB版,非常mini,改造成ITX版型也不难。
6+3相供电电路设计,虽然简单,但也足够应付220W的TGP。
这是RTX 4070的PCB板,对比一下,二者区别在于RTX 4070多一个空焊位,也就是少一相供电。
PCB板背面。
RTX 4070 SUPER采用的是AD104-350核心,芯片面积295mm2,拥有358亿晶体管。
GPU旁边是6颗美光GDDR6X显存,单颗2GB,总容量12GB,等效频率21GHz,带宽504GB/s。
三、理论性能测试:3DMark运行频率可达2805MHz
测试平台如下:
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme测试中,RTX 4070 SUPER图形分数达到了24185分,核心温度最高68℃,热点温度最高85℃,核心运行最高频率为2805MHz,最高风扇转速1397PM,整卡最高功耗222W。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 4070 SUPER图形分数达到了12112分,核心温度最高69℃,核心运行最高频率为2805MHz,最高风扇转速1397RPM,最高功耗222W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 4070 SUPER图形分数达到了20649分,核心温度最高75℃,核心运行最高频率为2790Hz,最高风扇转速2028RPM,最高功耗223W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 4070 SUPER图形分数达到了9948分,核心温度最高74℃,核心运行最高频率为2790Hz,最高风扇转速1399RPM,最高功耗224W。
四、1080P游戏性能测试:与RTX 3090 Ti旗鼓相当
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试结果汇总如下:
在1080P分辨率下,RTX 4070 SUPER的性能与RTX 3090 Ti不相上下,差距仅有1%。比起RTX 4070强了13%,和RTX 4070 Ti相比就差了3%。
六、2K性能测试:强于RTX 3080 Ti
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、霍格沃茨之遗
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、星空
12、战争机器5
测试数据汇总如下:
2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti强2%,与RTX 4070相比,也有14%的优势,但是比RTX 4070 Ti则有5%的差距。
此外我们还测试了4K分辨率下的成绩,汇总如下:
由于192Bit显存位宽的关系,RTX 4070 SUPER在4K分辨率下的性能会明年不如RTX 3080 Ti,但大多数游戏依旧能保持60FPS以上的帧率。
我们测试的12款3A大作,有3款帧率低于60FPS,但这几款游戏都支持DLSS 3,开启之后帧率会有翻倍提升。
六、Stable Diffusion体验:TensorRT加持 生图速度提升350%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能让具备Tensor单元的GeForce显卡在Stable Diffusion Web UI中获得翻倍的性能。
本次我们将对比SDXL加速方法与PyTorch xFormers(常规加速方法)的性能差异。
我们生成10张太空大战图像,分辨率1024*1024,使用PyTorch xFormers加速时,耗时9分17秒。
使用SDXL加速之后,耗时仅为2分02秒,性能提升350%。
从终端中也可以看到,RTX 4070 SUPER使用默认加速器时,生图速度只有1.1it/s,而在TensorRT加持下,生图速度猛然提升到了4.50it/s。
七、DLSS 3游戏测试之一:3款DLSS 3游戏
此次我们一共测试了6款游戏,包括3款支持DLSS 3的游戏:《3DMark》、《毁灭全人类》、《燕云十六声》。
另外还有3款同时支持DLSS与光追的游戏:《光明记忆》:《生死轮回》、《赛博朋克2077》。
所有DLSS 3以及光追测试都是在2K分辨率下进行。
1、DLSS3 测试--燕云十六声
《燕云十六声》是一款开放世界中国风武侠动作游戏,画质精良,号称国产3A破阵之作。目前这款游戏还处于内测阶段。
这款游戏于日前推送了对于DLSS 3支持的更新,下面我们来看看RTX 4070 SUPER的表现,测试分辨率为2560*1440,画质选项为“超高”。
默认超高画质下,游戏帧率为91FPS。
开启DLSS 2(性能模式)之后,帧率达到了146FPS,提升了60%。
打开DLSS 3(插帧)之后,帧率来到了198FPS,相比默认画质帧率提升了117%。
2、3DMark
DLSS 2模式下帧率为140FPS,比默认的65FPS提升了133%。
DLSS 3的成绩为150FPS,相比默认提升了150%。
3、毁灭全人类2:重新探测
最高画质下,RTX 4070 Ti的帧率为131FPS。
开启DLSS 3之后,帧率来到了242FPS,近乎翻倍。
八、DLSS 3游戏测试之二:3款支持DLSS 3的光追游戏
1、光明记忆:无限
开启RTX时,游戏的帧率为109FPS。
开启DLSS 3之后,帧率提升到了235FPS,提升了116%。
2、生死轮回
开启光追之后,游戏的帧率仅有65FPS。
打开DLSS 3之后,帧率提升到了195FPS,提升幅度为195%。
3、赛博朋克2077
开启光追时,帧率为40FPS。
这是DLSS 3的画面,与原生画面的差距难以分辨,但是帧率提升到了155FPS。
九、功耗测试:2K游戏平均功耗仅为3080 Ti的62%
将Furmark的参数设定为1920*1200分辨率、0AA。
运行13分钟之后,RTX 4070 SUPER的温度稳定在74度附近,功耗稳定在220W,烤机时GPU频率为1620MHz,CPU风扇转速只有2153RPM。
2)、真实游戏功耗测试
1、GTA V
这是1080P分辨率。RTX 4070 SUPER功耗126W,温度53度。
2K分辨率下,RTX 4070 SUPER功耗164W。
2、绝地求生
1080P分辨率下,RTX 4070 SUPER功耗203W,温度689度,运行频率2760MHz。
2K分辨率下,RTX 4070 SUPER0功耗212W。
3、古墓丽影:暗影
1080P分辨率下,RTX 4070 SUPER的功耗为207W。
2K分辨率下,RTX 4070 SUPER功耗是212W,运行频率2745MHz,温度64度。
测试数据汇总如下:
在1080P分辨率下,RTX 4070 SUPER在3A游戏中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,仅相当于RTX 3080 Ti的62%。
十、总结:堪称业界良心
本次测试小结如下:
1、AI性能
即使没有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion画图首选,而今在TensorRT加持下,RTX 4070 SUPER的生图速度在原有基础上提升了350%,这样的表现相信是不会再有任何竞争对手了。
2、1080P游戏性能
我们所测的12款游戏,除了《星空》之外 ,剩余11款游戏RTX 4070 SUPER的帧率全部都超过了160FPS,就连显卡杀手《赛博朋克2077》也有169FPS。
就性能而言,1080P分辨率下,RTX 4070 SUPER几乎能与RTX 3090 Ti并驾齐驱,相比RTX 3080 Ti强了6%,比RTX 4070则强了13%,和4070 Ti的差距只有3%。
3、2K游戏性能
2K分辨率下,同样是除了《星空》之外,RTX 4070 SUPER在其他11款游戏中都能保持120FPS以上的帧率。
在2K分辨率下,RTX 4070 SUPER依旧能比RTX 3080 Ti强2%,不过和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070则强了15%左右。
另外,我们也测试了4K,RTX 4070 SUPER在此分辨率下帧率会有较大损失,不过在绝大部分游戏中依旧能够跑出60FPS以上的帧率。
少数几款显卡杀手游戏虽然帧率只有50PFS左右,但好在这些游戏都支持DLSS 3,开启之后帧率甚至能突破100FPS。
4、功耗
我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。
2K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗是207W,RTX 3080 Ti则是332W。
4K分辨率下,RTX 4070 SUPER在6款游戏中的平均功耗为214W,RTX 3080 Ti则已经跑到了350W的TGP上限。
5、DLSS 3和光追
目前能玩的DLSS 3游戏多达数十款,我们测试了6款。
在开启DLSS 2之后,游戏帧率平均提升幅度为107%。打开DLSS 3,游戏帧率平均提升幅度达到了159%。
如今的NVIDIA GPU早已不是单纯的游戏显卡,特别是在AI应用方面,有了SDXL,能将Stable Diffusion生图速度提升4倍左右,让原本已经大幅度领先对手的N卡彻底无敌。
至于价格,4899元就能买到一块1080P性能堪比RTX 3090 Ti、2K性能强于RTX 3080 Ti的显卡,同时游戏功耗仅有200W左右,堪称业界良心。
RTX 4070 SUPER只是开始,接下来的RTX 4070 Ti SUPER和RTX 4080 SUPER将会带来更多的惊喜。
NVIDIAGeForceRTX40SUPER系列现已上市,请到京东DIYSUPER超能年货节上选购GeForceRTX4070SUPER/4080SUPER公版和合作伙伴显卡。
原文标题:2024年的第一张良心显卡!RTX 4070 SUPER首发评测