在本次测试的 RTX 4070 新卡中,大部分卡的 TGP 功耗都被设定在了 200W,导致性能几乎没有差别。而有这么一张卡,凭借越级的散热器设计,性能释放力压其它非公显卡一头,达到了 215W。它就是影驰 GeForce RTX 4070 星曜 OC。
IT之家也是提前收到了影驰 GeForce RTX 4070 星曜 OC,在本次测试中,我们将使用一套高配 intel 配置来测试,尽量避免显卡瓶颈。具体配置如下:
外观设计
影驰旗下的星曜系列显卡一直是高端炫光显卡的代名词。因此尺寸也特别大。这是一张标准的 3 槽的大型显卡,三围尺寸为含挡板:351*154*56mm。整体设计采用钻石风切割设计,内部则是无瑕的纯白。
GEFORCE RTX 4070 星曜 OC 依旧采用三风扇设计,这个散热模组被称为星卓 III 散热器。每个风扇有 11 片白色扇叶组成,透明的风扇设计可以让光线自由弥散到每一个叶片。
伴随着便捷灯控设置,当灯光亮起时,整张卡的外壳都会亮起,观感晶莹璀璨。
GEFORCE RTX 4070 星曜 OC 显卡的背板以白色为主,同时多处有星光设计,右侧有一处巨大的镂空,可以让风直接吹透,增强散热表现。
显卡背板最外圈是一层透明的包边,这个包边是可以自行拆卸的,玩家可以自定义出自己喜欢的方案。
比如影驰这次就提供了星曜娘校服新装的背板和外壳用来替换,这样一换整张卡瞬间变得二次元风格满满。
右上方印有 GeForce RTX 的标识,中间的 ARGB 灯光区域做了银色的镜面处理,点亮后会有星曜系列的 LOGO 会与风扇一起亮起。这个灯光也是具备实用性的,当出现供电不足或者安装问题时,它会闪黄灯或红灯来警告,被称为“负能量”检测系统。
供电方面,它采用最新的 ATX3.0 规范的 16Pin 供电接口,随包装内附赠了 2*8Pin 转 16Pin 的转接头。如果电源不虚标,CPU 配个 i5、R5 之类的百瓦 CPU,只要 450W 的电源都能带动整机了。最关键的是,它仅需单根 8Pin 一分二输出线就可以正常使用,这意味着有升级想法的玩家们,完全不需要换电源。
本次测试我们采用的电源是威刚的 XPG 魔核金牌全模组 750W 冰雪白电源,它通过了 80PLUS 金牌认证,14CM 的长度很适合小体积机箱,纯白模组线有与星曜显卡特别配,750W 的足额输出带 i9 + RTX 4070 绰绰有余。
I / O 接口挡板采用深灰配色,接口方面配备了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K 60 帧输出。
包装内除了转接线外,还附赠了一个显卡支架,这个显卡支架也是支持 ARGB 灯光的,可以与显卡实现灯光同步。
核心解析
RTX 4070 与 RTX 4070Ti 相似,都是基于 AD104 核心打造的,但核心规模上有所削减,因此核心代号为 AD104-250。具体削减的地方是 GPC 从 5 组变成了 4 组,内部共有 5888 个 CUDA 核心、184 个 Tensor 核心、46 个第三代 RT 核心和 64 个 ROP 单元,基本上可以理解为保留了 RTX 4070 Ti 80% 的核心规模。不过招牌的 NVENC 单元从两个变成了一个,这一点略有遗憾。
RTX 4070 的公版 BOOST 频率是 2475MHz,而影驰 RTX 4070 星曜 OC 由于越级的供电,默认频率就高达 2610MHz。显存方面则与 RTX 4070 Ti 保持一致。都是 192-bit 位宽的 12GB GDDR6X,带宽也都是 21Gbps。适合进行 2K 高帧率游戏。
影驰 RTX 4070 星曜 OC 依然采用了最新的 NVIDIA Ada 架构,并基于 TSMC 4N 定制工艺进行打造,从而实现了高达 2 倍的性能功耗比的巨大飞跃。它搭载的流式多处理器吞吐量超过了上一代产品的 2 倍,第三代 RT Cores 的光线追踪计算能力提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具备高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。同时,采用了 SER 技术,为光线追踪带来了最高可达 3 倍的性能提升,整体游戏性能也可以高达 25% 的提升。无论是在游戏还是在其他计算任务中,都能够带来卓越的性能表现。
新的 Ada 架构在具体功能上带来了许多新的特性:引入了光流加速器使得 DLSS 3 能够预测场景中帧与帧之间的运动变化,从而通过 AI 实现了帧生成技术,提高了帧率的同时保持图像质量。此外,新架构还支持 AV1 编码器的应用,从而降低了视频的体积,并获得更好的画质。在 AI 绘画、GPT 训练等生成式人工智能场景下能带来更强劲的算力。同时,RTX VSR 功能的应用也使得实时视频超分辨率成为可能。
理论性能
我们在开头就有说到,影驰 RTX 4070 星曜 OC 是首发所有显卡中性能的天花板。因为它突破了 200W 的功耗墙。实测烤机 15 分钟后,核心温度稳定在 59℃左右,显存温度约 73.2℃。整卡功耗达到了 215W,不仅性能释放比其他家高,温度还比其他家低,足可见堆料之足。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。实测影驰 GeForce RTX 4070 星曜 OC 的得分为 99.6%,性能释放极其稳定。
在 3DMark TimeSpy DX12 测试中,显卡分数达到了 19048 分,作为对比,公版 RTX 4070 的成绩是 18148 分。影驰 GeForce RTX 4070 星曜 OC 的确有不小的性能优势。这个成绩已经超越了 RTX 3080 10G,与 RTX 3080 12G 是基本相当的。
在 3DMark FireStrike Extreme DX11 测试中,影驰 GeForce RTX 4070 星曜 OC 的显卡分数达到了 22387 分,同样与 RTX 3080 12G 相近,也同样超越了所有同期的非公版显卡。
而在 3DMark Portal Royal 光追测试中,影驰 GeForce RTX 4070 星曜 OC 获得了 11116 分,比公版高了大约 500 分,也是能畅玩光追 2K 游戏的水平。
游戏实测
接下来,我们就进行一下游戏实测,分辨率调整为 2560*1440,画质统一调整为最高。首先是竞技游戏《CS:GO》,这款游戏可以展现 RTX 4070 在高帧下的表现。运行自带的 BenchMark 后,平均帧达到了 486 帧,可以满足 2K 高帧畅玩的需求,完全能跑满各种电竞屏了。
值得一提的是,目前十大主流竞技射击游戏中现已有八款支持 NVIDIA Reflex,这些游戏包括:《Apex 英雄》,《使命召唤: 战区 2》,《命运 2》,《逃离塔科夫》,《堡垒之夜》,《守望先锋》”归来”,《彩虹六号:围攻》和《无畏契约》,NVIDIA Reflex 能缩减操作延迟,提高响应速度,让跟枪更灵敏。笔者希望即将更新起源 2 版本的 CS2,也能支持 NVIDIA Reflex 技术。
接下来笔者还测试了两款经典 3A 大作。《荒野大镖客 2: 救赎》在不开启 DLSS 的情况下,GeForce RTX 4070 能达到平均 107 帧,已经能满足 2K 100 帧以上高帧畅玩了,这个体验无疑是非常出色的。
如果我们开启质量档的 DLSS,帧数会进一步提升到平均 124 帧,并且此时画质几乎没有损失,体验很出色。
在另一款经典的 3A 大作《古墓丽影: 暗影》中,帧数也比其他家的 RTX 4070 更高。在 2K 最高画质下运行自带的 BenchMark,已经能达到平均 182 帧,完全满足 2K165Hz 屏幕的畅玩。
在开启 DLSS 后,帧数表现更佳,能达到平均 214 帧,帧数提升了 30 多帧。总的来说,RTX 4070 在传统 3A 大作中的表现是很接近 RTX 3080 的。更是远超前代同级的 RTX 3070 Ti、RTX 3070、RTX2070Super。
以上这些只是开胃小菜,RTX 4070 的最吸引人之处在于其 DLSS 3 技术,可进一步提升帧率。DLSS 3 是一款由 AI 驱动的性能倍增技术,采用了全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,同时具备开创性的光学多帧生成功能,将为 NVIDIA RTX 神经网络渲染游戏和应用开启新的时代。
简单来说,过去的 DLSS 2 技术是通过渲染一个低分辨率图像,然后通过 AI 放大至高分辨率,从而提升画质和帧率。而全新的 DLSS 3 技术在兼容 DLSS 2 的基础上,新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出的全新帧,从而实现帧率的倍增。同时,结合 DLSS 2 的超分辨率功能,AI 能够重建多达八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升 4 倍!
目前已经有超过 280 款 DLSS 游戏和应用发布。其中共有 30 款已发布的 DLSS 3 游戏。从发布进度来看,在 DLSS 2 和 DLSS 3 各自发布的前六个月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍。看来适配难度是相当低的,相信将来有越来越多的游戏适配 DLSS 技术。
我们先来看看压力最大的《赛博朋克 2077》在光追 + 2K 分辨率下的帧数情况,在默认状态下,RTX 4070 还是没有办法畅玩的,平均帧数约 40 帧。如果开启 DLSS 2 质量,帧数就可以达到平均 71 帧畅玩了。而如果开启 RTX 40 系列专享的黑科技 DLSS 3,瞬间暴涨到了平均 107 帧,得益于更高的频率,影驰 GeForce RTX 4070 星曜 OC 的帧数总是比公版要高两三帧。
传奇 3A 大作《巫师 3:狂猎》最近也更新了次世代版,配置要求大大提高,当然画质也跟上了潮流,放在如今也毫不落伍。同时它也提供了 DLSS 3 技术的支持,这对于 RTX 40 系列显卡无疑是一个好消息。
《巫师 3:狂猎》次世代版在 2K 分辨率不开启 DLSS 的情况下,GeForce RTX 4070 平均仅有 44 帧,如果开启质量档 DLSS 2,就可以达到平均 65 帧。如果开启 AI 加持的 DLSS 3 技术,帧数就能暴涨到平均 100 帧,大部分场景可以实现 2K 百帧畅玩了。
在另一款画质爆炸的次世代 3A 大作《瘟疫传说:安魂曲》中,优化相对来说就要好不少了。即便不开启任何 AI 技术,也可以满足 2K 60 帧流畅游玩,而在 DLSS 3 加持后更是可以以电竞帧数畅玩。
实测 RTX 4070 在 2K 分辨率就已经能满足 76.7 帧畅玩了。如果开启 DLSS 2 质量档,就能达到平均 116.8 帧,如果开启 DLSS 3 插帧后,帧数更是会暴涨到平均 157.5 帧,满足 2K 144 高刷显示器畅玩。
那么隔代之间的显卡,性能会有多少提升呢?在 DLSS 3 技术的加持下又会有多少提升?笔者也顺便用这套配置换上 RTX 3070 Ti 测试了一套数据。在不开启 DLSS 3 的情况下,影驰 RTX 4070 星曜 OC 大约有 10% 的帧数优势。如果开启 RTX 4070 系列独占的 DLSS 3 技术,帧数几乎实现了 2-2.5 倍的增长,与 RTX 3070 Ti 实现了质的差距。
此外,我们还使用英伟达官方的 FrameView 工具统计了一下各个 3A 大作中的平均功耗。可以看出大部分 3A 大作中影驰 RTX 4070 星曜 OC 的实际功耗都在 200W 左右,散热压力很低,对电源的需求也会非常低。
创意生产
影驰 GeForce RTX 4070 星曜 OC 还支持安装 NVIDIA Studio 驱动,以加速 110 多款最受欢迎的创意应用,因此也具备了一定的生产力。专有的 SDK 能使这些应用的运行速度更快,并提供独家功能,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。同时大显存的加持也让它具备了一定的生成式人工智能的运算能力,拿来进行简单的 AI 绘画训练也是没有问题的。
在建模和渲染类软件中,影驰 GeForce RTX 4070 星曜 OC 的 5888 个 CUDA 核心可以提供硬件加速,使得工作效率得以提高。几乎所有的建模软件都会对 NVIDIA 的 GPU 进行优化,因此在效率、稳定性和兼容性方面都能够兼顾。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光线追踪功能,实现高性能的最终帧渲染。此外,搭载了 AI 降噪功能的 GPU 还可以进一步加速交互式渲染,提供更加流畅的工作体验。
我们也实测了一下 V-Ray Benchmark 的性能表现,影驰 GeForce RTX 4070 星曜 OC 获得了 1902 分,作为对比,公版 RTX 4070 的得分为 1842 分,完全可以应对大部分中等规模的建模渲染需求。
得益于光追性能的提升,GeForce RTX 4070 在 V-Ray GPU RTX 中的分数也提高到了 2699 分,同样高于公版的成绩,也能应付一些中等负载的光追建模渲染需求。
在视频后期这一块,RTX 4070 配备了 NVENC 编码器。并且也支持下一代视频编码技术 AV1,AV1 能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。随着各大视频平台希望节约服务器流量费用,AV1 编码必将成为未来的主流编码方式。
NVIDIA 与多家行业合作伙伴密切合作,确保其 GPU 能够充分支持当今主流的多媒体应用。目前,国内的剪映专业版已经实现了对 NVIDIA AV1 视频编码器的加速支持。而常用的视频调色剪辑软件 DaVinci 也提供了 AV1 编码的支持。这意味着 NVIDIA GPU 将来一定可以在处理视频编辑和渲染任务时充分发挥其 AV1 加速功能,提供更高效的性能和更流畅的工作体验。
IT之家还为大家测试了 PugetBench For Adobe 全家桶,看看它能否胜任视频剪辑工作。实测 GeForce RTX 4070 在创意工作者们常用的 Adobe Premiere 中,我们开启 GPU Cuda 加速,然后使用 PugetBenchmark 进行测试。最终得分为 1513 分,回看 4K 视频毫无压力。
另外一款压力更大的视频特效软件 Adobe Effects 中,我们同样使用 PugetBenchmark 进行测试。最终得分为 1637 分,能用来制作一些比较复杂的视效。
除了内容生产以外,在内容消费领域 RTX 4070 也有新功能。那就是 RTX VSR 技术。全称为 RTX Video Super Resolution(RTX 视频超分辨率技术)。它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,目前这一技术已经适配了 Chrome 浏览器和 Edge 浏览器,后续也会适配以 VLC 为首的本地播放器。
只要将 RTX 30 系列 / 40 系列的驱动程序更新到 531.14 以上版本,并将 Chrome / Edge 浏览器也更新到最新版本便可以启用。启用路径为:NVIDIA 控制面板 —— 视频 —— 调整视频图像设置。此选项框下有四个档位可选。档位越高超分辨率效果更明显,但也会消耗更多的 GPU 资源。
目前它已支持一些国外的视频平台(Youtube、Twitch、Netflix、Hulu 和 Disney+)以及国内的主流视频平台(哔哩哔哩、斗鱼和虎牙)。后续也会支持 VLC 本地视频超分辨率。在下面的测试中,从最左边的原生 480P 分辨率超分后,后面的 1-4 档能看出更加清晰了,实际观感媲美 4K。
↑ 从左至右依次为 480P、VSR1、VSR2、VSR3、VSR4
除了 Edge 和 Chrome 浏览器以外,知名的 VLC 本地播放器也在 Beta 版中提供了 RTX VSR 技术的适配。和网页一样,只要在驱动控制面板中打开就可以了。我们用一个 480P 的本地视频做演示,明显感觉右边更清晰了,后面大家欣赏本地电影时,也可以用这个技术进一步优化画质。
总结
笔者这次首发测试了 3 张 RTX 4070 新卡,影驰 GeForce RTX 4070 星曜 OC 毫无疑问是其中性能最强的存在。与旗舰卡同款的散热器设计风格,也让观感更为霸气。而在实际性能上,它仅需 RTX 3080 65% 左右的功耗,就可以实现更强的性能,在 DLSS 3 技术的加持下,游戏体验又被进一步提升了。
目前看来,RTX 4070 会是 RTX 3070\3070Ti\2070Super 这个档位的用户升级的好选择。影驰 GeForce RTX 4070 星曜 OC 将于 4 月 13 日晚 9 点发售,感兴趣的话可以关注一下。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。