借RTX 4070 GPU面世的时机,耕升推出了全新的“踏雪”系列,洁白纯色的外观让人眼前为之一亮,与我们印象中的黑红沉稳的“追风”形成了强烈的对比,想必它会深受“纯白”党的喜爱。
耕升GeForce RTX 4070踏雪(后文简称RTX 4070踏雪)显卡采用了NVIDIA新推出的AD104 RTX 4070 GPU核心,在技术核心特性上自然完全传承了Ada Lovelace架构的所有特色。按照惯例,还是先复习一下NVIDIA Ada Lovelace架构的核心要点。当然,如果你对Ada Lovelace架构的技术要点已经烂熟于胸,那么完全可以跳过这一部分,直接进入评测主题。
来自Ada架构的RTX 40系GPU技术创新RTX 40 系列 GPU 具有一系列新的技术创新,包括:
缓存暴增
Ada架构的改革在缓存部分有了较大改变。每个SM拥有128KB L1缓存,AD102总计拥有18432KB L1缓存,相比GA102的10752KB缓存增加了大约70%。在L2缓存方面,AD102目前拥有98304KB的L2缓存,相比之前GA102所拥有的6144KB大约是后者的16倍。如此巨大的缓存,将为所有GPU相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显。
更强的SM
AAD102的每个SM单元包含128个CUDA内核,1个ADA第三代RT核心以及4个ADA第四代张量(Tensor)核心、4个纹理单元、256KB寄存器、128KB的L1/共享内存,和之前的产品一样,L1/共享内存也可以根据使用情况进行配置。流式多处理器具有高达 83 TFLOPS 的着色能力,吞吐量超过上一代产品 2 倍。
第三代光追核心
第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。
Shader Execution Reordering着色器执行重排序
着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
DLSS 3与OFA光流加速器
基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。
新一代NVIDIA编码器(NVENC)
RTX 40系高端GPU实现了双第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。不过对RTX 4070来说,搭配的则是单个的第八代NVENC编码器和第五代NVDEC解码器。
更强的Studio性能
除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。
同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI 特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。
●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升 2倍。
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。
●Modder可以重制经典游戏,并通过RTX Remix开启RTX。
纯白喜好,TGP低至215W首先我们来看下RTX 4070 GPU的基本情况。核心代号同样为AD104,不过RTX 4070却是RTX 4070 Ti的规格缩减版。RTX 4070一共拥有23个TPC,46组SM单元,相比RTX 4070 Ti减少了14组SM单元和1792个CUDA核心。按照这样的配置,RTX 4070拥有46个光追核心(RT Core)、240个AI核心(Tensor Core)以及5888个CUDA核心。在核心规格配置上,相比RTX 4070 Ti精简了大约四分之一,也就是25%。不过在显存方面仍然保持了RTX 4070 Ti的12GB GDDR6X配置,显存位宽仍然为192bit,总带宽为504GB/s,与RTX 4070 Ti保持一致。因此从硬件规格方面来推测,RTX 4070与RTX 4070 Ti应该存在着20%~25%的性能差距。
与前一代的对位产品RTX 3070相比,二者在核心纸面规格方面相差不大,SM单元和CUDA核心数量都完全一致,不过RTX 4070的显存容量、速率以及核心频率的配置上都要明显超过RTX 3070,因此在性能上应该是比RTX 3070会超出很多。和前一代定位高一档的RTX 3070 Ti相比,虽然在核心的纸面规格数据上略逊色,但显存容量、带宽、核心频率都完胜RTX 3070 Ti,再加上全新的SM架构、更大的L2缓存和新一代的光追核心、AI核心,仍然可以期待RTX 4070在性能方面将完胜RTX 3070 Ti。
耕升GeForce RTX 4070踏雪解析回到耕升RTX 4070踏雪显卡。作为响应NVIDIA首发而推出的MSRP定位产品(与官方首发指导价格保持一致),RTX 4070踏雪作为全新的耕升显卡IP亮相,想要为逐渐成气候的白色显卡风潮注入一股清流。
耕升 GeForce RTX 4070踏雪有别于银色配黑色的“炫光”,也有别于红黑的“追风”,更不是披着华丽外衣的“星极”风格,它就像是一股清流。显卡整体采用了全新的纯白配色形象,很显然耕升也想借此打造一款或一个高颜值白色显卡系列。纯白的外框搭配纯白风扇,很能凸显出一种“雪景”的美感,能够给喜欢打造白色系主机的玩家提供更多的选择空间和思路。
▲显卡外框采用了白色ABS塑料材质搭配珍珠漆质感的同色涂装,保持了色调的一致性,也为RTX 4070踏雪增添了明亮的气息。在风扇框的外部低凹处,耕升还为RTX 4070踏雪设计了暗花的拉丝效果表面处理,从侧面看过去为整体的清雅又增添了几分游戏显卡应有的刚毅气息。
▲RTX 4070踏雪采用了超薄的散热结构,这使得显卡的整体厚度被控制在了4cm左右,使得RTX 4070踏雪成了一张标准的双槽卡,轻薄的卡身也降低了对机箱内部体积的要求,更适合搭建小型的白色主题主机。
▲背板部分也是同一色调设计,RTX 4070踏雪显卡采用了穿透式散热系统设计,背板右方进一步加大积镂空间,配合散热器上第三组风扇的风流直接穿透散热鳍片以及镂空的PCB设计,能够令显卡温度进一步下降。
▲电源接口采用的是标准8Pin供电,方便老电源用户平滑升级显卡。
▲在灯效部分,RTX 4070踏雪只保留了顶部的“GAINWARD”logo的RGB灯效,和华丽的炫光系相比显得更加文雅素净,也与产品的整体形象相符。
▲输出接口同样是3DP 1.4a+1 HDMI 2.1的组合
▲RTX 4070踏雪采用了名为“风雪”的散热结构,虽然是薄鳍片设计,但整体鳍片面积却得到了加量,再加上铜底座和4根6mm镀镍复合热管,散热性能也有比较不错的保证。
▲在PCB部分,RTX 4070踏雪采用的是8层短PCB设计,8+2相供电,短PCB可以在一定程度上强化散热。
▲RTX 4070的核心代号为AD104-250-A1,和RTX 4070 Ti同源。
▲显存颗粒仍然是来自美光的GDDR6X,单颗容量2GB,共6颗。
耕升GeForce RTX 4070踏雪产品参数
核心架构:Ada Lovelace
核心代号:AD104
制程工艺:TSMC 4N定制
SM单元:46
CUDA核心数(流处理器):5888
光追核心数(RT Cores):46
AI核心数(Tensor Cores):184
核心频率:1920MHz~2535MHz
显存容量:12GB GDDR6X
显存速率:21Gbps
显存位宽:192bit
显存带宽:504GB/s
支持DLSS版本:DLSS 3
TGP:200W
建议搭配电源额定功率:600W
显卡厚度:双槽
首发参考价格:4799元
性能实测,比RTX 3070 Ti强20%+作为新上市的GPU产品,RTX 4070的性能表现到底如何也是大家最关心的问题。同样,耕升RTX 4070踏雪在实际应用中又会交出怎样的答卷呢?带着一系列疑问,我们决定从游戏、创作、AI应用和功耗表现四个方面对它进行一番考验。为了更直观感受RTX 4070踏雪的性能表现,我们在测试中加入了上一代的RTX 3070 Ti、RTX 3070和前两代的RTX 2070 SUPER作为对比参考对象
测试平台
显卡:耕升RTX 4070踏雪、RTX 3070 FE、RTX 3070 Ti FE、RTX 2070 SUPER FE、七彩虹战斧RTX 4070 Ti(部分测试)
CPU:英特尔酷睿i9-13900K
主板:技嘉AORUS Z790 MASTER
内存:影驰名人堂DDR5 6000 32GB
电源:鑫谷昆仑冰山1250W(ATX 3.0)
显示器:戴尔UP3218K(7680×4320@60Hz)
操作系统:Windows 11 Pro 22H2
显卡驱动:NVIDIA Game Ready Driver 531.42
▲RTX 4070踏雪的出厂Boost频率为2535MHz,相比NVIDIA公版指导频率的2475MHz略高。
DLSS 3性能测试首先来看RTX 40系最核心的DLSS 3性能的表现,这也是RTX 40系显卡非常重要的一个价值附加点所在。
我们用13款DLSS 3游戏来体验了RTX 4070踏雪的性能表现,最后的测试结果也没令人失望。在全部参与测试的DLSS 3游戏中,RTX 4070踏雪开启DLSS 3之后,相对于原生帧率的提升幅度平均达到了150%以上,在个别游戏中的性能提升幅度甚至达到了400%。而在DLSS 2开启的情况下,帧率的平均提升幅度只有75%左右。性能表现确实非常不错。
除了带来帧率上的突飞猛进之外,DLSS 3带来的另一优势是由于集成了NVIDIA Reflex,因此开启DLSS 3之后,将会带来更低的游戏延迟,对MOBA、大逃杀或FPS类游戏玩家来说,其意义也是非常重大的。同时随着DLSS 3对平均游戏帧率的大幅提升,1%L fps这个影响游戏卡顿的参考值也随着大幅度提升,这也使得在开启DLSS 3之后,游戏体验变得更加平稳和顺滑。
编者注:随着《反恐精英2》(Counter-Strike 2)的最新加入NVIDIA Reflex,十大竞技射击游戏中现已有九款支持NVIDIA Reflex,前六名更是全部支持。这些游戏包括:《Apex英雄》(Apex Legends), 《使命召唤:战区2》(Call of Duty: Warzone 2)、《命运2》(Destiny 2)、《逃离塔科夫》(Escape from Tarkov)、《堡垒之夜》(Fortnite)、《守望先锋:归来》、《彩虹六号:围攻》(Rainbow Six Siege)和《无畏契约》(Valorant)。
我们在13款DLSS 3游戏中选择了9款来进行了DLSS 3开启前后的PCL系统延迟及1%L fps的测试。从测试数据中可以清晰地看到,RTX 4070踏雪开启DLSS 3之后,所有测试游戏的PCL系统延迟都得到了极大幅度的降低,最高降低程度甚至超过了80%。比如在《传送门》RTX版游戏中,1440p分辨率下的PCL系统延迟达到了145ms,开启DLSS 3自动开启Reflex之后,PCL系统延迟瞬间降低到了50ms左右,延迟的降低程度达到了60%以上,显然这会给游戏玩家带来更顺畅丝滑的游戏体验。
再来看下参测的对比显卡RTX 3070 Ti和RTX 4070踏雪在DLSS都开启情况下的性能表现,这一测试主要体现新一代GPU支持的DLSS 3相对于上一代GPU仅支持的DLSS 2在性能上又带来了多大的变化。
仍然是基于我们之前选择的13款DLSS 3游戏,在最高画质、光追开启的设置下,我们可以看到开启DLSS 3的RTX 4070踏雪相较于开启DLSS 2的RTX 3070 Ti在1080p分辨率和1440p分辨率下性能上领先70%,在《巫师3:狂猎》等游戏中甚至接近翻倍。
传统游戏性能测试DLSS 3游戏测试中,RTX 4070踏雪表现出了足够强势的性能,那么在传统的光追、光栅游戏中,不借助DLSS 3的支持,RTX 4070踏雪在性能上相比上一代的对位产品又有多大的优势呢?
测试选取了近期比较热门的19款游戏大作,其中既包括DLSS 3游戏,也包括DLSS 2游戏和不支持DLSS的游戏,同时也涵盖了光追和非光追游戏两大类。在游戏的画质设置中,我们统一设置为游戏默认最高画质(《生化危机4:重制版》除外,因为该游戏如果设置最高显存占用渲染的话,会导致RTX 3070 Ti及以下的显卡直接崩溃)和,并在光追游戏中开启光追效果。
先看1440p分辨率下的情况。在1440p分辨率下,RTX 4070踏雪在开启DLSS 2之后,在绝大部分游戏中的帧率都达到100fps+,实现了1440p@100+fps的光追游戏体验目标。对比上一代的RTX 3070 Ti,RTX 4070踏雪在1440p分辨率下的平均游戏性能领先前者约22%左右,相比RTX 3070,性能上的领先更达到了30%以上。
1080p分辨率下的传统游戏性能测试基本与1440p分辨率下的测试结果相当。这一分辨率下RTX 4070踏雪的游戏性能仍然领先RTX 3070 Ti 20%以上,领先RTX 3070则接近30%。
测试也就直接证明,即使不依赖令游戏性能猛增的DLSS 3,RTX 4070踏雪的GPU硬能力也远超过了上一代的RTX 3070 Ti和RTX 3070,领先幅度也在20%以上。
设计创作与AI计算最后来看下RTX 4070踏雪的设计创作性能和AI计算性能,毕竟配置了大量的第四代Tensor Core和全新SM架构的CUDA核心,RTX 4070踏雪的AI计算性能也是我们比较感兴趣的点。
视频转码
在视频转码性能测试上,Davinci Resolve 18测试中,在H.264的编码性能上RTX 4070踏雪领先RTX 3070 Ti和RTX 3070约16%,在H.265的编码性能上领先程度更是达到了30%以上。而在剪映Pro的4K视频转1080p编码测试中,RTX 4070 FE的H.264编码性能领先RTX 3070 Ti和RTX 3070约30%~40%。这也足以说明RTX 4070踏雪搭配的第八代NVENC编码器和第五代NVDEC解码器在效率上已经远超前一代产品。
视频转码方面的另一大优势是实现了对AV1格式视频的GPU硬件编码加速支持。相比传统的H.264或H.265格式视频,AV1视频拥有相同码率、分辨率下更小体积的视频和更好的视频质量,也代表着未来主流视频的趋势。
▲在视频相同码率和分辨率下,AV1格式编码(图左)相比H.264编码(图右)有更清晰一些的视频质量和更小的视频体积。
3D渲染能力
3D渲染能力的测试上,可以看到无论是Blender还是V-Ray中,RTX 4070踏雪的表现都同样的抢眼,3D渲染能力相比RTX 3070 Ti领先约30%以上,相比RTX 3070领先更是达到了40%甚至更高。
AI计算能力
在ON1 Resize AI 2022软件中,我们选择了5张5K照片,并将其等比无损缩放到200%(10K+级精度照片)。从测试结果来看,RTX 4070踏雪的图片AI处理性能明显遥遥领先,相对RTX 3070 Ti、RTX 3070和RTX 2070 SUPER的领先程度分别达到了30%、35%和70%左右。
接下来我们体验了NVIDIA RTX VSR(RTX Video Super Resolution,RTX视频超级分辨率)技术带来的视频AI增强处理功能。简单来说,它可以通过细节增强让视频播放更加清晰。
目前要实现VSR需要两个硬性条件,其一是必须基于RTX 30系以上的GPU并得到驱动程序的支持,其二则是需要支持VSR功能的浏览器或播放器。我们测试所用的Game Ready Driver 531.42驱动程序已经开放了对VSR的支持,目前最新版的Chrome和EDGE浏览器也提供了对VSR的支持。
▲勾选RTX视频增强选项下的“超分辨率”,就能在支持VSR功能的浏览器中开启RTX 视频增强。
我们在测试中分别使用FireFOX(不支持VSR)和最新版的Chrome浏览器(支持VSR)播放同一段游戏4K录像,并在NVIDIA ICAT软件中对比不同浏览器播放的录屏视频,以此观察VSR的增强功能。同时,我们也在两个浏览器内开启了哔哩哔哩网站,在其中播放同一段1080p视频并进行录屏分析考察VSR的作用。
▲在《生死轮回》游戏录像播放中,我们可以清楚地看到支持VSR的Chrome浏览器播放时(图左)在清晰度和细节表现上相比FireFox浏览器要优秀得多,说明VSR实实在在地在起作用。
▲B站的一段《暗黑破坏神4》的宣传片播放结果也同样如此,在视频质量的呈现上,Chrome浏览器在VSR的增强处理下,比FireFOX浏览器的视频清晰度和细节更优秀。
最后来看看AI计算。测试我们选择的是基于AI图片生成计算的Stable Diffusion,相信不少玩家都已经尝试过这一有趣的基于AI模型的图片运算生成软件。测试中我们选择了NovelAI-WEBUI-AKI的国内玩家封装版整合包,并手动安装了最新的NVIDIA cuDNN以实现对RTX 4070 GPU的加速计算支持。
在测试中我们设置了一系列关键词,最终目的是生成坐落于水畔的优雅别墅和足球场景。通过两类图片的AI计算生成速度,我们可以衡量RTX 4070踏雪的AI计算能力与RTX 3070 Ti、RTX 3070等的差距。
整体测试结果非常清晰明了,RTX 4070踏雪在AI图片生成能力上达到了平均约9.04张/秒的速度,是RTX 3070 Ti的1.2倍,是RTX 3070的约1.3倍。而与即使是号称目前最强处理器之一的酷睿i9-13900K相比,RTX 4070踏雪的AI计算能力更是达到了前者的180倍左右!
散热、超频与功耗来看看RTX 4070踏雪的功耗表现。虽然TGP设定在215W,不过我们测试数据显示,在游戏环境下,RTX 4070踏雪的平均功耗约为188W左右,与215W的TGP相差较大,也说明了RTX 4070 GPU的能耗比相比RTX 3070 Ti等前一代以及RTX 2070 SUPER等前两代产品,确实有着非常大的优势。更低的功耗、更强的性能,带来的结果自然就是能耗比的巨大飞跃式进步。
在温度控制方面,虽然RTX 4070踏雪为满足双槽卡的轻薄性采用的是超薄散热器设计,但散热性能方面也完全合格,经过Furmark烤机20分钟后,GPU温度保持在65℃左右,还是比较理想的。
在超频性能方面,由于RTX 4070踏雪的出厂频率接近公版标准,因此它还是有一定的超频空间。我们经过简单调校之后,它能够在2750MHz Boost频率,11000MHz显存频率的设置下顺利通过所有压力测试。此时的性能相比超频前有大约5%的提升,玩家们不妨自己尝试。
纯白系装机的性价比之选作为一款全新的形象,RTX 4070踏雪较好地完成了踏雪系产品的首秀任务。在性能方面,RTX 4070踏雪相比RTX 3070 Ti有20%~25%领先幅度,相对于RTX 3070的领先幅度约为30%~35%。在DLSS 3的加持下,差距还会进一步拉大到75%以上。同时,它的设计创作以及AI计算能力皆有不错的表现,再加上非常优秀的能耗比,都使得RTX 4070踏雪的价值得到了强化。从游戏性能测试结果来看,RTX 4070踏雪也很好地完成了1440p@100fps+的目标,为那些致力于高特效1440p光追游戏的玩家提供了一个非常合适的选择。另外它的电源接口也回溯到了传统的8Pin,玩家也完全可以节省一台新电源的钱用于强化其他配件(200W的TGP让RTX 4070踏雪对电源的需求并不高)。尤其是对于当下主流的万元预算装机方案来说,如果你想要搭配纯白色的装机主题,那么价格与首发指导价一样的耕升RTX 4070踏雪就是非常值得考虑的对象。高性能、低功耗、纯白的外观、“触底”的价格……当这些组合在一起,你还有啥挑剔的呢?
微软资讯推荐
win10系统推荐