1RTX 3090 Ti有何提升
序言
距离RTX3090发布后的526天,NVIDIA正式发布消费级的顶级旗舰产品——NVIDIAGEFORCERTX3090Ti24GB。老黄的这一操作其实让很多人都没看懂,自家RTX3090稳坐旗舰产品头把交椅,苏妈RX6950也迟迟不来,急啥?完整的GA102核心就让他在行业中发热发亮好了,钱不是能赚得更多?
而且在这一代RTX30系列显卡中,中高端显卡的SKU数量真点多,放弃RTX20系列的Super后缀,但却捡起了Ti的后缀,同时以显存容量作为后缀的显卡也出来了,算上RTX3090Ti,基于GA102核心的产品已经达到了5个之多,风中的确有点零乱。
同时按照整个RTX30系列产品生命周期来说,此时该发力的应该是中端以及入门级显卡,重点是加大GA106/107(或者会是GA117?)核心产能才对。但即便这样,既定的事实是:NVIDIAGEFORCERTX3090Ti24GB真来了。
难道真的GA102核心产能过剩太多?急着加价清掉?还是其他不可描述的原因?这个事我们就管不上了,我们来关心一下,RTX3090Ti的发布更多是满足游戏用户还是内容创作者?
有哪些提升?
提升1:完整GA102核心
作为顶级的旗舰产品,这次RTX3090Ti终于用上了全规格GA102核心,这很大程度满足了不少强逼症高端玩家。毕竟之前GA102核心一直都是被用到行业中的RTXA6000显卡上。
原图点击放大
从规格表上来看,完整GA102核心RTX3090Ti有着更高的规格,相比RTX3090补全2组SM单元,达到了10752个CUDA流处理器、84个RTCores、336个TensorsCores、以及112个光栅化处理单元。从理论上来看,RTX3090Ti有着更为出色的性能表现,但核心的小幅差距的确是很难与RTX3090拿开明显的差距,我们再来看看,此次RTX3090Ti还有什么方向的加强。
提升2:更高核心频率、更高的功耗
原图点击放大
RTX3090Ti核心基础频率达到了1560MHz,Boost频率达到了1860MHz(FE公版)。只不过RTX3090TiFE公版是真没几块,所以NVIDIA直接开放给AIC们着手打造,大部分的RTX3090Ti非公显卡Boost频率达到了1890MHz,实际游戏时的核心频率自然是更高。
核心频率更高的缺点就是功耗增高,RTX3090默认TDP就是350W,建议电源需求为750W。而RTX3090Ti默认TDP已经达到了450W,大部分的非公版MAXTDP更是达到了480W,这对电源的需求是猛增的;NVIDIA官方建议是采用850W电源,但笔者这里建议大家采用1000W或者是1250W的电源(最好是带12VHPWR接口原生模组线的电源),这样也更好的兼容未来的RTX40系列显卡。
提升3:密度与频率更高的显存颗粒
RTX3090Ti这次在显存方面也进行了升级,首次采用512Mb*32Bit、21Gbps规格的GDDR6X颗粒(带ECC),颗粒FBGA编号为:D8BZC。虽然Micron官方并未正式对外公布此款详细规格,有兴趣的网友可以参考一下编号D8BGX的GDDR6X颗粒规格,同样是21Gbps,但颗粒密度仅是256Mb*32Bit【MT61K256M32JE-21】。
显存频率的提升我们都知道为何好处,但是512Mb*32Bit这些名词,许多网友都不大明白是什么意思。笔者这里简单地讲解一下,目前RTX3090采用的就是256Mb*32Bit、19Gbps规格的GDDR6X颗粒,编号为D8BWW;换算过来其实就是单颗显存的容量为1GB,想要组成RTX3090的24GB,需要正反PCB双面排满24颗显存颗粒,因此也造成了大部分购买RTX3090显卡的用户抱怨显存温度过高的问题。
而512Mb*32Bit规格的GDDR6X颗粒D8BZC,换算过来就是单颗2GB的显存容量,仅需要正面共12颗显存即可实现,这样PCB设计更为简单,且显存模块的发热量控制也更出色,经我们实测,显存监测点温度的确低温不少。
提升4:显存带ECC功能
RTX3090Ti是消费级市场上唯一一款带上了ECC(Error-correctingcode)的显卡,这功能解决了显卡在长时间高负载应用中出现的显存报错问题,能为生产应用可靠性提供更好的保障。
默认情况下,RTX3090Ti是没开启ECC功能的,大家需要在NVIDIA控制面板上找到相应的ECC开启选项;同时开启ECC功能后,显卡性能是会相应的降低。而ECC功能一般也仅存在行业显卡上,例如同样是GA102核心的RTXA6000。
提升5:12VHPWR辅助供电接口
12VHPWR辅助供电接口,网络上讨论最为火热的话题之一,这将会是未来PCIe5.0显卡的供电接口,按照目前已经了解到的资料来看,此12VHPWR接口最大可提供600W的供电。而RTX3090Ti非公版显卡抢先配置了这一12VHPWR辅助供电接口,寓意着玩家们可以从此时起更换新电源了?
显卡接口端采用了12VHPWR,但我们非一定接上12VHPWR接线才能使用吗?实现上12VHPWR中的小4Pin定义仍未设定下来,我们直接使用Micro-Fit12Pin接口的接口即可进行辅助供电。
30系列FE显卡配置都是双*8Pin辅助供电转换线,而RTX3090Ti为确保辅助供电能达到450W,AIC厂商们为我们配备了Micro-Fit12PinTo3*8Pin转换线,这样大家就不用担心转换线的问题,只需要看看电源是否有3个8Pin供电接口,电源功耗是否足够即可。
赠送的这线规格是真不错,一般电源线材采用的18AWG规格,而这线带上NVIDIA信仰LOGO外,还采用的是16AWG规格线材,线材更粗,电流导通值更大。
有兴趣的网友可以研究一下Micro-Fit12PinTo3*8Pin转换线的线定义。
提升6:保留NVIDIANVLink
与行业卡RTXA6000、消费级的RTX3090一样,RTX3090Ti保留了NVIDIANVLink3.0高速GPU互连接口,这并非之前我们了解到的SLI接口那么简单。这NVLink一般只用在行业显卡中,通过这一技术连接两块NVIDIA显卡,实现显存与性能的性能扩展。
笔者拿NVIDIA提供的NVIDIANVLink技术动图参照一下。根据GA102核心的特性,RTX3090Ti采用第三代NVIDIANVLink。两块RTX3090Ti使用NVLINK桥接器后,最高可实现112GB/s最高传输速度,扩展后显存更是高达48GB,可加速图形和计算工作负载,并能处理更大的数据集,可快速组建成高性能比的台式工作站。
但由于此次RTX3090Ti大部分的非公版显卡基本是三槽的设计,所以若你想两块RTX3090Ti组成NVLink,那么你就得看看自家的主板是否留有足够的位置与散热空间。如图上的两块RTX3090Ti背靠背,散热空间明显不太足够,四槽空间才是你最佳的选择。
小结:从规格上来看,RTX3090Ti更像是一块高频率、配备GDDR6X显存、更大功率的RTXA6000显卡,只不过RTX3090Ti仅是消费级的产品,许多行业性的功能都被去掉。
即便是这样RTX3090Ti仍是目前消费级市场上最为强劲的存在,规格是完整的GA102核心,核心频率、显存规格、性能都是绝对的强悍,当然功耗也是比较恐怖的450W。
RTX3090Ti的未来
从行业来说,Ampere架构已经并不算是什么新鲜的事,毕竟其发布已经有比较长的时间。尤其是NVIDIA在最近的GTC2022上发布Hopper架构那是相当诱人。但是不可否认的是Ampere架构是目前消费级市场上最为出色的架构,其有着全新的SM多单元流处理器,高性能的单精度浮点(FP32)运算处理速度,以及优异的性能功耗比,可显著提高图形与模拟工作流的性能。
同时第2代RTCore与第3代TensorCore的加入,让显卡在运行光线追踪、着色或降噪功能上更为强劲,大幅加快工作负载的运行速度;同时AI运算能力也更为强劲,无需要修改源代码即可实现更高速度的AI运算与数据科学模型的训练。
实际上RTX3090Ti的发布还真是时候,在刚过去的GTC2022上,NVIDIA还不单是发布一系列的高规格硬件,还有不少行业用户与开发者们引领方向的技术,例如:NVIDIAOMNIVERSE、NVIDIADRIVEMap、NVIDIAMaxine、NVIDIAAI加速等。虽然大部分技术一般消费者们也不会太懂,但这些技术与应用最终也会反馈到我们用户身上,而RTX3090Ti凭借其最强的消费级显卡的身份,24GB大显卡,自然是可以能用上未来的软件与游戏。
例如DLSS技术,目前就已经超过150款游戏现已支持NVIDIADLSS,还在不断地增加中,包括了最近发布的一系列游戏大作,幽灵线:东京、消失的光芒2人与仁之战、影子武士3等。当然还有更多的RTX30系列显卡特性技术:NVIDIADLAA、NVIDIAReflex以及RTXGI,这些如果没一块强劲的RTX30系列显卡还真的玩不转。
2影驰RTX 3090 Ti 星曜OC外观&拆解
影驰RTX3090Ti星曜OC
回归一下我们的主题,此次我们并没有拿到RTX3090TiFE公版,收到的是影驰GeForceRTX3090Ti星曜OC【下述简称:“RTX3090Ti星曜OC”】。
家族式的设计,每块星曜显卡都有着相同的外包装设计,同系列的外观设计,当然不同级别的显卡有着不一样的做工用料就是了,尤其是这块影驰RTX3090Ti星曜OC用料是星曜系列最猛的,没有之一。
家族式的设计如何识别就得靠外包装上的产品型号了,NVIDIA统一的产品型号标识:NVIDIAGEFORCERTX3090Ti。
背部是此款显卡的一些功能性特点描述,包括星卓ⅡPlus散热器、炫曜灯效、PCB设计、魔盘软件,以及三年质保(支持个人送保)。
两个实用的配件:显卡支撑杆,以及Micro-Fit12PinTo3*8Pin转换线。
外观上下,RTX3090Ti星曜OC采用了影驰RTX30系列中经典的星曜透明水晶外壳元素设计,白色的导风罩配上透明水晶外壳,拆掉水晶外壳就可以自定义图案。不得说的是,此块RTX3090Ti星曜OC是真的大,两个10cm+一个9cm风扇武力值是拉满了,很强很大很重很吓人。
对比一下RTX3080TiFE显卡,整整的大了在圈,其它显卡在RTX3090Ti星曜OC显卡面前还真是弟中弟。
当然不单是大,而且还真的重,RTX3090Ti星曜OC裸卡重量就达到了2.1KG,而RTX3080TiFE也就1.37KG,看谁不顺眼还真能做个高贵的高级板砖。
显卡的背板是白色星曜背板,高强度的铝合金材质,整块显卡除了PCB与散热并非白色外,还真能配套成白色主机。而白色的背板也能为各位玩家提供更好的DIY空间,涂鸦什么的贴纸什么的上一堆,也是比较有个性化的。
显卡尾部为多孔散热设计,降低散热器风压反弹效应,强化散热效能。
NVLink接口
12VHPWR辅助供电接口
可利用赠送的Micro-Fit12PinTo3*8Pin转换线进行供电
输出接口为三个DP1.4a与一个HDMI2.1,均支持单接口实现8k视频输出,同时也可以利用四个接口,组成四联屏使用。
影驰RTX3090Ti星曜OC拆解
影驰RTX3090Ti星曜OC显卡PCB采用了非公的设计,在公版PCB方案的基础上进行改动。此款PCB方案有别于一般GA102核心方案,供电更为强大大,且做工相当的工整,总有一种类似于行业显卡PCB方案的感觉。
越肩式PCB的设计,让显卡看上去更为巨大,且铺满元件的PCB实在是太养眼了;同时PCB背面不再有显存的位置,尾部也做了镂空的处理,唯一的不足就是供电位置和SP-CAP空焊的位置较多,估计这PCB方案会有更高频率的RTX3090Ti出现,那时这些空焊位置应该都会被补全。
RTX3090Ti核心编号:GA102-350-A1,生产周期为21年46周,四周是12颗GDDR6X显存颗粒。
供电模组采用了前后两个供电模块的设计,共20+4相超级数字供电,整个PCB均采用了SMD用料,焊接工艺成熟,电气性能更强,稳定性也更好。
供电前后端都有大量的SP-CAP用作滤波处理,取代了常规的固态电容,整块显卡上也找不到任何一个固态电容。
每相供电均配备了高效低温的DrMos,型号为MP86957,由MPS美国芯源系统生产,最大持续输出电流为70A。20+4相*70A的设计,你想到此款显卡的供电模块有多猛了吧?
主控PWM控制芯片同样是来自MPS美国芯源系统,型号为最新的MP2891,单颗控制20相显存供电,规格相信比常见的MP2888A更为强劲不少。而PCB前后共两颗us5650Q则是4相显存供电控制器。
12VHPWR接口,接口做工明显更为出色,比一般的6Pin/8Pin接口更为稳固;显卡尾部为显卡的电压监测点,玩家或者是工程师们可以快速对显卡进行电压监测,方便大家进行超频或者维修。
散热器为星卓ⅡPlus散热模组,相当的大且重,整块显卡的重量大部分都是来自散热器。星卓ⅡPlus散热采用了6+2条热管两段式散热鳍片式的大型三风扇散热器。
GPU底座为镀镍铜底可快速吸收并传递GPU热量,而GPU、显存、供电模块等多个不同的部分均采用一体式覆盖散热设计,并配备导热与黏性较高的散热垫辅助供电。
这角度可清晰地看到星卓ⅡPlus散热主体的热管走向,2条8mm+4条6mm粗热管贯穿两段不同的散热鳍片,其余2条为U型设计。
散热器主体的做工还是可以的,鳍片扣Fin+两条固定杆,加强整个散热器的刚性。
同时热管均采用了回流焊接的方式与散热片进行固定,散热效能得到很好的保证。
拆解就到这里了,值得注意的是,显卡标配的是三槽挡板,若挡板位置受机箱插槽限制、或者是更换水冷组成双槽显卡的用户,可以自行更换赠送的双槽挡板。
3测试平台介绍
测试平台介绍
测试平台我们挑选了目前消费级市场上最为顶级的一批硬件组成测试机进行对影驰GeForceRTX3090Ti星曜OC显卡进行测试。I9-12900K搭配ROGMAXIMUSZ690EXTREME主板+芝奇TridentZ5RGB幻锋戟DDR5+龙神II360一体水冷散热器,既能满足游戏玩家的需求,同时主板丰富的扩展性能还能满足内容创作者与微型计算工作站的需求。
至于显示器方面,由于手头上我们并没有8K显示器与电视,所以此次测试中游戏部分我们利用DSR技术来缩放8K分辨率进行游戏测试,同时会通过8K视频的解码、渲染,以及导出来对显卡进行测试。
至于电源方面,我们选用的是鑫谷最新推出的80PLUS金牌产品GM1250W全模组电源。虽然850W电源产品即可满足RTX3090Ti非公版显卡的供电需求,但是为测试过程中不出意见事故,所以还是挑选1250W大功率的电源更为保险;GM1250W配上了Micro-Fit12Pin的原生模组线,但测试时我们优先使用了官方提供的Micro-Fit12PinTO3*8Pin的转换线,以保证测试顺利进行。
4理论&游戏性能
3DMARK理论性能对比
从3DMARK理论性能来看,NVIDIA真是刀法如神,一个GA102核心,把分成了五款产品,同时每款产品之前有着5~7%的性能差距。相比RTX3090显卡,RTX3090Ti增加2组SM,以及更高频率的设定,让其有着更为出色的性能表现。若是拿RTX3080显卡作对比,那24%性能提升还是真香的,前提是不考虑价格与功耗。
值得注意的是,刚才我们的对比表格里是不算上NVIDIADLSS功能测试,DLSS2Performance8K项目,有着12GB显存容量的RTX3080Ti直接在此测试项中爆显存,性能自然是不具代表性。另一方面也证明了,若想在8K分辨率下开启DLSS玩游戏,没有RTX3090Ti或者是RTX3090这级别的显卡是不行的。
游戏性能对比:
游戏测试
在测试前,其实笔者对RTX3090Ti性能表现其实并不抱太大的希望,毕竟同为GA102核心的RTX3090显卡性能已经相当不错了,即使全规格GA102再配上高频性能提升也有限才对。但让笔者没想到的是450WTDP显卡果然是不能小看的,单纯的2K游戏性能就已经领先了RTX3080Ti约10%;而随着分辨率来到4K,领先幅度更是上升到了约15%性能,这样的性能差距还真让我满意。
当然若你认真看看游戏性能综合比例,你会发现,这样的五款显卡的性能差距与理论性能的差距基本是一致的,真怀疑老黄是拿着直尺去切割核心的,居然能做到如此的精准的性能定位。
光线追踪游戏测试
同样我们还进行了2K与4K分辨率四款游戏的光追性能测试,测试时默认开启DLSS平衡模式。其实五款显卡在光追游戏中的表现与常规游戏中的表现是一致的,RTX3090Ti作为老大哥仍是一马当先。
而大家可以细看《古墓丽影:暗影》与《看门狗军团》这两款游戏中开启光线追踪与DLSS后,游戏帧数表现仍是相当的流畅,所以我们在4K分辨率下直接开启光线追踪来畅玩游戏即可。
再来8K游戏测试,可以说RTX3090Ti玩8K游戏是可以的,但游戏画质太高会造成帧数过低的情况,所以笔者建议大家玩8K游戏时注意一下画质设定,可以恰当地牺牲画质从而达到更高的游戏流畅度。
PS:全境封锁2,极高画质,DSR8K分辨率玩游戏时爆显存
5生产力测试
创作者能力对比
创作者性能测试上,RTX3090Ti与RTX3090显卡性能差距约为1%左右,部分应用中的确会领先些许,但是就那么几秒的差距,若时间成本允许其实可以选购更好性能功耗比的显卡。
不得不提醒的是,RTX3090Ti是目前唯一一款拥有ECC技术的消费级显卡,在渲染大型工程文件时,笔者建议大家开启ECC技术,从而获得更稳定的渲染表现。
PS:开启ECC功能后,显卡性能会下降
正由于RTX3090Ti在综合的创作者性能表现拉不开差距,所以笔者直接把PugetBenchDaVinciBenchmarkExtended测试中的每个细项拉出来对比一下。Extended测试中比默认的测试增加了8K视频的测试,这样大家可以更清晰地看到性能差距。
若是主力视频创作的UP主,相信RTX3090Ti会是给你带来更快的渲染速度。若是预算有限,笔者其实建议选购RTX3080显卡即可,能可满足大部分视频与创作应用的需求。
6功耗与温度测试
功耗温度对比
功耗测试真的真的真的让RTX3090Ti显露出了其450WTDP本性,单纯的CPD功耗就已经达到了326.4W,比RTX3080FE整卡功耗都要高了。而细看会发现Micro-Fit12Pin接口供电还是比较给力的,直接提供了409.7W供电,PCIe也就36.7W;按照影驰此款RTX3090Ti星曜OC显卡最大480WTDP值来看,频率上升空间还是有的。
同时不得不说的是RTX3090Ti星曜OC显卡散热效能是真的可以,室内常温是25温度下,Furmark满载核心的温度也仅是70.6度,此时显卡频率还能保持在1440MHz,风扇转速也仅为52%,噪音并不明显。
当然最厉害的要数显存温度,512Mb*32Bit规格的GDDR6X显存颗粒就是好,单面12颗就能满足24GB显存容量,不用担心过热的问题。RTX3090Ti星曜OC显卡Furmark时显存温度80度,而双面显存的RTX3090显卡显存温度达到90度,整整低了10度。
724GB显存如何用光?
24GB显存到底怎么用?
在测试RTX3090Ti显卡的时候,笔者利用HWINFO软件对测试时显存占用进行了记录。可发现大部分的应用与游戏中仅有少部分显存下高于10GB容量的,仅有部分的游戏在显存占用时高于10GB,例如《全境封锁2》与《PugetBenchDaVinciTest》。当然8K游戏的显存占用基本都是翻了翻,游戏中的显存占用均超过10GB,其中《全境封锁2》中更是爆了显存。
当然,除了游戏之外,实际的专业应用场景才是RTX3090Ti这24GB显存容量的用武之地,接下来我们借助视频、计算、建模的三个小例子,来“榨干”这张RTX3090Ti的24GB显存吧。
《DaVinciResolve》8K实时渲染
一般情况下DaVinci并不会过多调用显存,无论是播放还是转码,RTX3090Ti在测试时占用也就10GB左右。
而我们利用NVIDIA提供的8KRAWVideo测试项目文件,对MotionEffects(运动效果)进行一系列的设置,这样就能调用到24GB显存。
同样8KRAWVideo播放,显存占用就已经达到了24GB,还真是有点夸张,当然此时更换其它低容量版本的显卡会直接报错,停止运行的处理。那这样设置后,RTX3090Ti是否有优势呢?我们同样拿此项目文件直接进行视频导出,对比导出时间。
可看到同样的MotionEffects(运动效果)设置,效果较低的一般情况下,RTX3090Ti、RTX3090与RTX3080有着同样的导出速度,且相同的显存占用,均为10GB;但是加强MotionEffects(运动效果)设置后,RTX3080Ti明显报错加载不了运动效果,仅有RTX3090Ti与RTX3090有导出成绩,分别为1:34、1:39。侧面说明:24GB大容量显存在某些大型,且极复杂的视频渲染工程时起到关键性的作用。
机器学习运算
在机器学习的实际应用上,我们使用一个开源的CNN图像数据分类模型来进行基准测试。它采用的是市面上应用广泛的机器学习库——TensorFlow,在搭建好CUDA组件环境后,TensorFlow便可以使用GPU进行加速运算,大显存能为显卡提供更多的计算资源支持,在这里我们把显存可占用空间设置为“全部”,然后以2组batches、32个样本为单位,跑10万组图像数据识别,可以看到24GB显存在运算过程中直接吃满,最后达到一秒钟识别将近3万张图像的性能表现。
BLENDER场景渲染
而在热门3D建模软件blender上,由于内置的Cycles渲染器在交互渲染的过程中。会利用实时RTX光线计算和OpitXAI去噪技术的实时加载,对于显存的要求较高,对于重度用户而言,即便是12GB的显存容量,在多工作流下也会发生显存不足导致渲染错误或无法渲染的情况,而利用RTX3090Ti的大显存,则是能够实现多个复杂工作流实时查看交互,还能进行最终帧的场景渲染,此时显存占用也达到了21GB以上。
8总结:迟来的新皇
总结:迟来的新皇
性能真强
450WTDP设计的RTX3090Ti注定有着极为强悍的性能,从一系列的测试中,就能够验证这一切,基本是以绝对的优势领先同为GA102核心的其它四款显卡。而完整的GA102核心很好地满足骨灰级玩家的需求,满血才是真爱!
当然450WTDP为我们带来了供电的烦恼,买得起RTX3090Ti显卡的人自然少不了高功率电源,但是12VHPWR辅助供电接口注定了需要使用转换线,或者是再定制一条兼容的Micro-Fit12Pin模组线,这都是笔不少的投入。
但庆幸的是,非公版显卡的供电和散热都是相当的给力,如我们测试中使用的影驰RTX3090Ti星曜OC有着20+4相强劲的供电设计,以及高效的多热管三风扇散热器,可以确保RTX3090Ti长时间地高频率运行。
谁会购买?
你说NVIDIAGEFORCERTX3090Ti到底值不值得买吧?这个还真不好说,爱的爱死,这RTX3090Ti是相当值的,完整的GA102、高核心频率、24GB大容量高规格显卡、更强劲的供电,这么强劲性能的显卡,无论干什么都可以的,如果不行,那再买一块用NVLink连上即可。RTXA6000一半的价格都不到,就能买到,强逼症的玩家不受死才怪。
恨的自然是恨死,RTX3090Ti有着绝对的性能实力是无疑的,但是性价比不高呀,比RTX3090/3080Ti贵上不少,但是性能提升却有限,尤其是性能功耗比也差了点,电源不给力还得更换电源,这投入成本太多了。
所以购买RTX3090Ti还真的量力而行,看看自身需求是否一定要使用上如此顶级的显卡才是硬道理。
如何购买?
想购买的用户,你们可以放宽心。据了解,NVIDIA为AIC们提供了大量的RTX3090Ti满规格GA102核心与GDDR6X显存颗粒,你们只需要保证钱包足够厚就可以购买到RTX3090Ti显卡了!
微软资讯推荐
win10系统推荐