耕升RTX 4070 SUPER 踏雪黑神话定制版显卡评测

更新时间：2024-09-25 12:54:26作者：relsound

如果问哪款游戏是今年玩家心中的NO.1，那么当属游科的《黑神话：悟空》，为此众多显卡厂商也推出了黑神话联名款显卡，今天给大家带来的则是耕升GeForce RTX 4070 SUPER 踏雪 OC 定制版显卡的评测。耕升RTX 4070 SUPER 踏雪黑神话定制版显卡评测

截止目前，《黑神话：悟空》在Steam平台的销量已经达到了1900万份，全网销量保守预估已超2000万分。作为国产第一款走向世界，极限跨圈的3A游戏，着实令人兴奋。并且由于游戏内很多物品和景色均采用实地取景，甚至吸引了不少鉴宝博主的游玩和点评。

关于黑神话的成功不必多说，而首批持观望态度的玩家，现在也正打算升级自己的配置，来体验真正影视级的画面，下面就让我们来一起看下耕升GeForce RTX 4070 SUPER 踏雪 OC 定制版显卡。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在外包装上采用了黑神话天命人主题，即便是踏雪系列标志性的纯白色调，这次也改为了黑色。

下面来看显卡本体，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡的正面已就位纯白色调，仍然保持了踏雪系列的风格。整体尺寸约为315×122×40mm（不含挡板），占用2槽空间，作为一款中高端产品来说，它的厚度控制的比较出色。

散热方面，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡整体采用了“风雪”散热模组。主动散热的风扇部分，采用优化后的3个92mm炫风之刃风扇，经改良后提升风流量，并减低声噪，有效加强散热，纤巧的体积更可大大减低对机箱空间的要求。而在扇叶外侧，还新增了特殊构造风扇罩，大幅提高气流稳定性并能降低噪音。而风扇中央的扇标设计，则是熟悉的“雪花标”。

内部散热上，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡采用大面积紧密散热鳍片，高效铜板搭配4跟6mm复合式热导管，并且热导管加入了镀镍设计，进一步加强抗氧化能力。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡的背板采用了定制外观，以天命人为主要视觉，神态表情刻画颇为细腻，也彰显了游戏内角色和游戏外玩家，重走西游的决心。

散热方面，背板采用了穿透式散热系统设计，右方进一步加大积镂空间，配合散热器上第三组风扇的风流直接穿透散热鳍片以及镂空的PCB设计，令显卡温度进一步下降。

视频输出接口上，依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。从侧面可以看出耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相当轻薄。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡侧面可以看到16pin供电接口，它的TDP功耗为220W，建议电源600W及以上。

本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造，采用TSMC 4N NVIDIA定制工艺，旗舰核心AD102达到了的760亿个晶体管，而在RTX 30系显卡中为280亿个。

与上一代NVIDIA Ampere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升，最高可达到90-TFLOPS的着色器数据吞吐量。

本次发布的RTX 4070 SUPER共有7168个CUDA核心，提供了35.5-TFLOPS算力；56个第三代Ada RT Core拥有82.1 RT-TFLOPS；224个第四代Tensor Core可提供568 Tensor-TFLOPS（AI TOPS）。

RTX 4070 SUPER的L2 Cache容量为48MB，带宽为504 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性，我们以两张图来简单说明L2缓存的作用。

在真正的GPU中，内核是所有计算发生的地方，而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存，紧挨其处理内核，使L1成为GPU寻找信息的首选。然而由于L1缓存需要离内核非常近，不可能非常大。

如果在L1缓存中找不到内核计算所需的数据，GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上，并通过一个非常高速的横梁系统连接到所有的GPC（图形处理集群），每个GPC包括多个SM。如果在L2缓存中找到了信息，那么GPU就挑出这些数据并将其放入内核。

如果在L2缓存中找不到信息（被称为缓存缺失），那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量，并降低了性能和功耗效率。

更多详细的参数，我们为大家总结出了一张表格，可以看到从各方面的规格来说，这张RTX 4070 SUPER更接近于RTX 4070 Ti，但功耗相比RTX 4070只提升了20W。

首先介绍一下测试平台，为了保障耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡的性能发挥，我们的平台采用了上代旗舰i9-13900K。

下面还是来看看本次评测的显卡参数，目前最新的GPU-Z为2.60版本，参数识别较为详细。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡拥有7168个CUDA，Boost频率为2550MHz，较公版的2475MHz提升较大。

显存方面，12GB GDDR6X显存，位宽为192bit，显存带宽504 GB/s，光栅单元和纹理单元为80和224。

既然是黑神话悟空的定制版显卡，那么就先来测试一下这款由虚幻5引擎制作的游戏。另外《黑神话：悟空》支持DLSS以及FSR，并且均可开启帧生成，但是DLSS可以搭配全景光线追踪提供更逼真丝滑的游戏体验，所以我们本次DLSS测试，均在开启帧生成下记录帧数。

测试分别在2K及4K分辨率下进行，虽然RTX 4070 SUPER这张显卡定位2K高帧率的3A游戏，不过可以看到，在DLSS超级性能模式下，这张耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡也有着82帧的流畅水准。不过想要在打斗中享受电竞级帧率体验，还是建议在2K分辨率下。

另外目前《黑神话：悟空》在设置上还有几点需要注意，就是超采样清晰度和分辨率。

《黑神话：悟空》没有提供直接的档位，而是滑块拖数字来改变档位。经过我们实测，在同一档位中，DLSS的缩放比例是相同的，所以得到的帧数也完全相同。大家只看“质量”或“性能”档位即可。

还有就是分辨率调节，《黑神话：悟空》目前没有全屏独占，只有窗口化全屏，所以在游戏内设置低分辨率，而桌面仍然用高分辨率的话，帧数提升并不明显。

经过实测，我们发现两端同步调节分辨率，相比只降低游戏分辨率，帧数差距非常大。

虽然大部分游戏大家都没有将分辨率玩的情况，但《黑神话：悟空》采用的虚幻5引擎，非常耗费配置，如果玩家想通过降低分辨率来获得流畅的帧数，还需特别注意。

光线追踪对比

《黑神话：悟空》在模型上，采用了虚幻5引擎的Nanite虚拟微多边形几何体系统，它消除了LOD的繁琐任务，可以扫描并导入极高精细程度的模型。并且，这不会影响性能，仍然可以获得实时帧速率。因此，在游戏中我们可以看到大量高精度模型，而其中很多都是直接扫描自实地。

下面直接看效果对比。

在开启光追后，上图充分展示了“多重反射光线追踪间接照明”，自然色彩的光线能够在整个世界中反弹两次，创造更真实的间接照明和遮蔽效果。在河边的树林中，关闭光追的情况下，场景非常暗，而经过间接照明，能提供更准确的场景和物体光照，符合自然规律，使每个场景的沉浸感拉满。

《黑神话：悟空》最能体现光追效果的地方还是在水中，除了之前大家比较熟悉的光线追踪反射，这次游戏中还加入了“光线追踪焦散”。

当足量的光线从特定表面的反弹出来时，照亮一些物体的表面区域，使其亮度高于场景中的均值。上图最能说明这一点，其中水面上的涟漪显示在水下附近物体的表面上。这样一来，游戏中的水体再也不会像以前一样，如同镜子般光亮，而是有了更真实的水体效果。

DLSS 效果对比

本次《黑神话：悟空》中，超分辨率采样也是大家关注的焦点之一，毕竟以目前显卡的性能来说，即便是RTX 4090，要想在4K分辨率下开启光线追踪跑原生影视级画质，也是无法流畅运行的。

上面我们提到过《黑神话：悟空》采用了Nanite虚拟微多边形几何体系统，可以导入极高精细程度的模型。所以DLSS在“猜想”上，也有了更多凭据。

而《黑神话：悟空》也是目前我见过游戏中，DLSS效果最好的。可以看到，由于有复杂模型作为支撑，即便是在超级性能模式中，场景中所有的景物，包括主角的衣服，都和原生画质几乎毫无区别，但帧数相比原生画质，足足提升了200%还多。所以如果你感觉帧数不够，大可以将超采样清晰度降低一些，来获得稳定的高帧率。

全局光照效果对比

除了光线追踪和DLSS，《黑神话：悟空》还有一个画质选项有较多争议，就是全局光照。有的玩家说要开到最高，有的说最低才更真实。

下面我们就来实际对比一下，从图中能明显看到，在全局光照低的画面中，亮的地方更亮，暗的地方又难以视物。而在全局光照超级中，画面整体更加平衡，即使暗的地方，也保有更多细节。

所以经过几组对比，大家很明显能发现“全局光照”这个概念，重点就在全局二字。

举个简单的例子，在完全漆黑的房间中，有一束手电光。在没有全局光照的情况下，我们只能看到这一束光所照的范围。而有全局光照的加持，我们能借助这一束手电光的反射来看到整个房间的全貌。

并且经过实测，全局光照档位的高低，对帧数完全没有影响，所以大家在设定画面时，建议把全局光照开到最高。

本次耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡主要对比它的上下型号，RTX 4070 Ti以及RTX 4070。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装：FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能，取显卡分数实际测试结果如下：

在FS测试中，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070，其中FS提升16%；FSE提升16%；FUS提升21%，综合提升18%。对比RTX 4070 Ti，综合成绩相差3%左右。

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相较RTX 4070的提升分别为：TS提升14%；TSE提升14%，综合约为14%。对比RTX 4070 Ti，综合成绩相差8%左右。

PortRoyal是3DMARK中专门针对光追性能的测试项，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相较RTX 4070的提升约为14%。对比RTX 4070 Ti，相差8%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡对比RTX 4070，提升为16%。

在DLSS 3的理论测试中，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在2K分辨率下DLSS开关相比RTX 4070的提升为16%/22%；4K分辨率，提升约为15%/22%。

从整体的理论测试成绩来看，传统的FS/TS/PR三项测试，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070综合提升约为16%左右；相比RTX 4070 Ti的差距在6%左右。

由于本次RTX 40系加入了DLSS 3新技术，所以后面会进行单独测试，这里依然选择主流的几款3A大作进行游戏性能对比。

在《极限竞速：地平线5》中，其中耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070提升明显，1080p达到12%，2K分辨率提升14%；4K分辨率提升17%，综合提升14%。

在《刺客信条：幻景》中，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070的提升分别为：1080p提升8%；2K提升10%；4K提升15%，综合提升11%。

在《无主之地3》中，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070的提升分别为：1080p提升21%；2K提升17%；4K分辨率提升16%，综合提升18%。

《光明记忆：无限》的光追测试软件是独立于游戏的测试工具，比游戏中用到的光线追踪技术更多，测试条件为“RTX最高/DLSS质量”。

性能方面，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡相比RTX 4070的提升分别为：1080p提升20%；2K提升24%；4K提升29%，综合提升24%。

在“游戏测试标杆”的《赛博朋克2077》中，耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在超级画质下，2K分辨率百帧完全没有问题的；在光追超级画质下2K流畅运行同样没有问题；而作为次世代光追体验的超速模式中，2K分辨率下只有52帧。

不过上面我们的测试均为DLSS 2模式，尚未开启DLSS 3，下面在DLSS 3的专项测试中，能够看到帧数上的飞跃。

从上至下依次为超级画质/光追超级/光线追踪：超速模式。可以看到光线追踪：超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径，其实相比之前的光线追踪模拟了更多光线在不同表面的反射，完整的计算出了场景的真实光照，避免了上一代光追中出现“死黑”的情况。

另外《赛博朋克2077》更新了DLSS 3.5，支持光线重建技术。在上面的测试图中不难发现，光线重建能够更加精准的计算出反射部分的效果，接近于亮面金属表面的反射中，未开启RTX能够看出画质明显的区别，不再赘述。重点在于DLSS 3.5的开关效果，除了广告牌上所显示的内容更清晰外，放大后能够看到远处电线以及工业区建筑的细节外观。

随着NVIDIA DLSS、NVIDIA Reflex以及先进的光线追踪技术的普及速度不断加快，现在已有超过600款RTX游戏和应用，为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

在DLSS 3的测试中，首先来看《赛博朋克2077》的，我们同样会将DLSS 3与DLSS 2的结果进行比对。

本次我们分别对《赛博朋克2077》，在三档画质下进行了DLSS 3的帧数测试，所有档位均开启DLSS质量记录帧数。

可以看到在2K分辨率下，在是光追超速模式，开启DLSS 3后耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡能达到81帧的成绩，已经是流畅运行标准。

另外DLSS 3技术主要针对于CPU瓶颈的游戏，所以也能够看到在越低的分辨率，帧数提升越大，其中光追超速的1080p分辨率能够达到51%左右的提升。

《星空》仍在持续更新，在加入了DLSS 3后，整体来看效果非常好，即便在4K分辨率下也能够达到87帧的流畅水准。

其中1080p分辨率下DLSS 3相比DLSS 2提升达到62%；2K分辨率提升50%；4K分辨率提升43%。

《地平线5》也是显卡测试的老朋友了，其出色的优化让很多入门级产品都能跑出较高的帧率。在耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡也有较明显的体现。在3种分辨率中，开启DLSS 3相比DLSS 2的提升分别为40%/29%/12%。

V-Ray

在生产力工具上，我们测试了最新版本的V-Ray渲染器，选择使用GPU渲染的CUDA测试和RTX测试，成绩如图。

Blender

Blender是一款专业的三维渲染软件，目前推出了固定的benchmark跑分软件，省去了安装软件下载素材的麻烦。软件会自动渲染测试monster/junkshop/classroom共三个场景。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡得分分别为3074/1498/1590分，平均2054分。

AI时代不知何时已经离人们的生活越来越近，小到文本改写，大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力，不过目前NVIDIA推出了全新的TensorRT插件。可以充分调用Tensor算力，下面我们来测试一下耕升GeForce RTX 4070 SUPER 踏雪黑神话悟空联名款显卡在这方面的性能表现。

我们的测试使用UL Procyon进行，在最新的测试项目中，SD1.5可分为INT8（8位整数）和FP16（半精度浮点）运算。

可明显看到，采用INT8的运算时间更快，不过这并不意味着INT8在性能上更具优势。

这里简单说明一下，INT8是使用更低精度的整数表示数据的一种方式，用于进一步减小模型的存储空间和加快计算速度。使用INT8可以在一定程度上降低模型的计算复杂度，特别适用于部署在资源有限的设备上，如移动设备、嵌入式设备等。

FP16则是一种占用存储空间较小的浮点数表示方法，用于在深度学习模型中减少模型参数和中间结果的存储需求，从而节省内存空间并提高计算效率。

不过在测试中并没有包含FP32的单精度浮点运算，其实在深度学习模型中，完整的逻辑应当包含在内，下面也简单进行介绍。

FP32是常见的浮点数表示方式，提供了更高的数值精度，适用于大多数深度学习模型的训练和推理过程。FP32 的精度比FP16高，但会占用更多的存储空间和计算资源。

所以从运算精度上来说：FP32 > FP16 > INT8；而从内存占用上来说是：INT8

上图测试结果为模型更复杂的SDXL，可以看到测试总时间为261.141s。

另外，UL Procyon的AIGC测试同样使用了StableDiffusion进行批量生成，相较我们手动生成图片，结论更为精准。

目前RTX 视频超分辨率（RTX Video Super Resolution）已经在部分浏览器中进行测试，首先玩家需要更新到NVIDIA最新驱动，在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。

RTX 视频超分辨率是 AI 图像处理的突破，它超越了传统的边缘检测和特征锐化技术，极大地提升直播视频内容的质量。

开启RTX 视频超分辨率不仅需要最新版驱动，还需要使用RTX 40或30系列GPU，并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容（浏览器也需要更新到最新版本）。

开启后，目前已知的打开YouTube或者B站，都可以享受到RTX VSR效果的加成。

如果不确定，在全屏播放视频时，可以打开任务管理器，看到GPU负载增加，即为开启成功。

（点击放大查看原图）

在下面这幅图的对比中，可以明显看到开启RTX 视频超分辨率后，胡须明显更顺滑，已经看不出马赛克。

不过需要注意的是，RTX 视频超分辨率在低分辨率下效果会更明显，如果本身观看的视频为1080p或2K以上，则基本很难看出区别。

这对于一些网速不够快，只能看低分辨率视频的用户，或者视频片源本身不够清晰的情况，帮助非常大。

功耗测试中，我们选择FurMark软件进行拷机测试，并采用GPU-Z检测温度，功耗仅计算显卡自身。

在最新的Furmark中，已经集成了相当多的功能，甚至还有benchmark跑分，不再是单纯的拷机软件。

耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡通过1小时左右的拷机测试，温度在66℃左右，热点温度在78℃左右。

RTX 40 SUPER系列显卡在整体定位相信大家早已了解，而RTX 4070 SUPER这个型号个人认为是目前3A游戏玩家首选。

综合来看，RTX 4070 SUPER相比RTX 4070提升在15-20%左右，与RTX 4070 Ti的差距在5%左右，提升是巨大的，基本已经追到了RTX 4070 Ti的级别。

虽然RTX 4070 SUPER它定位2K分辨率的高帧光追游戏，但不管是日常网游、独立游戏，或是传统3A游戏，在4K分辨率下都能够达到流畅甚至电竞级水准。

本次耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡其实收藏意义更大，作为国产第一款采用虚幻5引擎的3A游戏。不仅走向世界，更创造了多项纪录，甚至传奇游戏制作人小岛秀夫，都在《黑神话：悟空》销量破1000万分的时候转发了图片，表示肯定。

这对于中国游戏玩家和中国单机游戏行业来说，必定是载入史册的一年。相信时隔多年后，当你关闭电源后，看到机箱中静静“躺着”的天命人，依然能记得当初的那份感动。

而经过《黑神话：悟空》这道“大餐”，目前越来越多优秀的国产3A游戏正在涌现出来，也让玩家充满期待。

目前耕升GeForce RTX 4070 SUPER 踏雪OC 定制版显卡在各大电商中均有售卖，感兴趣玩家不妨前去了解一下。

(9000450)

耕升RTX 4070 SUPER 踏雪黑神话定制版显卡评测

耕升RTX 4070 SUPER 踏雪黑神话定制版显卡评测相关教程

热门推荐

耕升RTX 4070 SUPER 踏雪 黑神话定制版显卡评测

耕升RTX 4070 SUPER 踏雪 黑神话定制版显卡评测相关教程

热门推荐

耕升RTX 4070 SUPER 踏雪黑神话定制版显卡评测

耕升RTX 4070 SUPER 踏雪黑神话定制版显卡评测相关教程