在今年 1 月举办的 CES 2025 上,英伟达发布了基于 Blackwell 架构的 GeForce RTX 50 系列游戏显卡。IT之家首发拿到了这张七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡,它更新到全新一代 Blackwell 架构,拥有 GDDR7 32GB 超大显存,DLSS 4 技术,也是首批可以买到的非公显卡之一。
七彩虹的火神系列一直以大气硬核的外观设计,独特的配件体验以及一键超频的满血性能而闻名。本次我们就借助一套旗舰配置,来看看它能否接替 RTX 4090 D,成为新一代游戏卡皇。本次测试平台具体配置如下:
一、外观设计
七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡延续了上一代硬核的赛博科幻风设计,但整体造型更加方正内敛,配合纯黑雾面金属卡身 + 银白不规则包边 + 小三角红色点缀组合,更显高级感,手感和质感都得到了不小的提升。
全秩序感的视觉风格是火神系列显卡的特点之一,所有装饰元素都做到了视觉上的中置对称,金属压铸工艺和庄稼上的斜切纹路、银白包边,官方称之为“金属外骨骼”,斜切设计通常与暴力美学挂钩,高端和霸气相结合,大概就是七彩虹想要带给玩家的感觉。
正面 3 风扇规格为 107mm 大口径,9 片扇叶,采用「风镰」设计,风扇轴柱部分印有白色的 iGame 和七彩虹 Logo。
显卡的黑化金属背板设计明显更加赛博和个性,无论是右侧的进气开口,背板上的凹凸纹理还是左侧的 GEFORCE RTX 文字,通过斜切 + 斜视效果,营造出一种充满力量的速度感。
体积方面经过IT之家实测,iGame GeForce RTX 5090 D Vulcan OC 32GB 显卡的三围分别是 360*135*71mm(不含金手指与挡片),裸卡重量(不含磁吸屏幕组件)约 2.88kg。
显卡的两侧均采用 2 组斜切镂空开口,内部采用 7*8+2*6mm 热管 + 真空冰片技术,确保显卡拥有出色的散热效果。底部一侧配备了 16pin(12+4)供电接口 + 8pin 灯光同步接口,还有用于连接智屏和灯光组件的磁吸触点。
显卡另一侧可以看到新版 PCIe5.0 规格的全新金手指。
灯光组件可直接吸附在显卡侧边,开机即可激活炫酷灯效,适合追求纯粹颜值的外观党。
智屏配件拥有 2 组磁吸触点,兼容横、竖两种显卡安装方式,也可以吸在底座上单独摆放,并通过 iGame Center 定制屏幕显示主题、自定义图片和动态 GIF 图,玩法非常丰富,个性化体验拉满。
配件方面还是一如既往的丰富,12+4pin 转 4*8pin 电源转接线,一套可拆卸的铝合金显卡支架、一根 RGB 灯光控制线、一把可替换头的金属螺丝刀,一个独立智屏磁吸底座,一个方形磁吸彩色智屏以及一个磁吸灯光组件。
七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡的 I/O 金属挡板上,配备了 3 个 DP2.1b 接口和 2 个 HDMI2.1b 接口,支持最高 8K / 165Hz 输出。能够一键超频的实体按钮自然也不能落下,这是七彩虹的专利设计,让普通玩家也能轻松享受到超频性能体验的乐趣。
二、架构解析
NVIDIA GeForce RTX 5090 D 采用了全新的 Blackwell 架构,官网的介绍页面赫然写着一列“专为游戏玩家和创作者打造的致胜平台”,其中所代表的就是游戏性能和 AI 性能的爆增。英伟达称,目前对于画面质量的追求已大幅度超越了摩尔定律所能够提供的运算性能,加入神经网络渲染势在必行。
由于加入了神经网络渲染,Blackwell 的多单元流处理器 (SM) 具有更高的处理吞吐量,并与 Tensor Core 更紧密结合,从而优化神经网络着色器的性能。
为了满足下一代 DLSS 多帧生成的帧率稳定性需求,Blackwell 架构搭载了基于硬件的 Flip Metering,将帧率逻辑转移到显示引擎中,使得 GPU 能够更精确地管理显示时间。同时显示引擎还增强了两倍的像素处理能力,以支持更高的分辨率和刷新率,从而释放 DLSS 4 的性能潜力。
在第五代 Tensor Core 中新增了对 FP4 浮点运算精度的支持,FP4 是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率。FP4 使用显存不到 FP16 的一半,GPU 性能的提升却高达 2 倍。在生成式 AI 应用中,GeForce RTX 5090 D 的 FP4 图像生成速度是 RTX 4090 D 上 FP16 的 3 倍,显存消耗减少一半。
在 RT Core 方面,提升了检测光线、路径与三角形相交的效能,可以对大量几何图形细节进行光线追踪。在新一代 Blackwell 架构下光线、路径与三角形相交的检测效率为上一代的 2 倍,初代使用 RT Core 的 Turing 架构的 8 倍,并增强了压缩以减少内存占用,相比上代的显存使用率节省了 25%,光线追踪效果也得到了前所未有的细节提升。
除了技术上的提升,Blackwell 架构的 GPU 还搭载了 GDDR7 显存。GDDR7 采用的是 PAM3 信号编码机制,与 GDDR6 和 GDDR6X 有所区别。PAM3 每两周期的数据传输为 3 位,相比 GDDR6 和 GDDR6X 更省电,带宽也进一步提升,速度高达 30Gbps。
Blackwell 还通过 PCIe 5.0 和 DisplayPort 2.1b UHBR20 实现了增强,单一通道支持 20Gbps 带宽,从而支持高达 8K 165Hz 的显示器。Blackwell 架构 GPU 配备了第九代 NVENC,支持 H.264 / H.265 4:2:2 编码的 8 位和 10 位视频输出。
具体到产品规格上,iGame GeForce RTX 5090 D Vulcan OC 基于最新一代 GB202 核心和 TSMC 4N 架构制程工艺打造,内有 21760 个 CUDA 核心、680 个 Tensor 核心、170 个光追核心、680 个纹理单元、176 个 ROP 单元,核心规模相比 RTX 4090 大致相当,但解锁了完整的 GPC 单元,单元内的 SM 和 TPC 群组数量均有增加。
GeForce RTX 5090 公版的核心频率范围是 2010MHz-2410MHz,而 iGame GeForce RTX 5090 D Vulcan OC 显卡在启用一键超频后,频率范围会变成 2017MHz-2527MHz。显存方面升级为 512-bit 32GB GDDR7,带宽来到了 1792GB/s。TBP 功耗为 600W,相比上代 RTX 4090 增加了 150W。
三、理论跑分
作为一款非公旗舰显卡,七彩虹 iGame GeForce RTX 5090 D Vulcan OC 火神会在公版显卡的基础上带来怎样的提升呢?接下来就进入理论测试环节。
先看烤机,单烤甜甜圈 20 分钟,GPU 的核心温度稳定在 70℃左右,显卡频率 2700MHz,功耗稳定在 600W 左右,和公版保持一致,恰好卡在目前 12+4pin 显卡电源接口的最大输出功率。单显卡的功耗就来到 600W,搭配 i7 / i9 或锐龙 7、锐龙 9 这样的高端处理器,最好还是用 1200W 的电源一步到位。
在 3DMark Time Spy DX12 测试中,七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡分数达到了 49164 分,作为对比 GeForce RTX 4090 公版的分数为 34725 分,提升幅度达到了 41.5%,相当可观。
而在 3D Mark Time Spy Extreme DX12 测试中,七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡分数达到了 26117 分,作为对比 GeForce RTX 4090 公版的分数为 19924 分,提升幅度达到了 31%。
在 3DMark Portal Royal 实时光追测试中,七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡的综合分为 37502 分,作为对比 GeForce RTX 4090 公版的分数为 25080 分,提升幅度达到了 49.5%。
通过 3D Mark 一系列的显卡测试项目跑分不难发现,RTX 5090 D 的图形性能提升非常猛,30%-50% 左右的提升幅度足以让它傲视群雄,登顶新一代卡皇的宝座。当然,以上测试数据都是基于七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡一键超频模式下结果,相比默频分数要高上 4%-5%,证明了这张卡的性能上限更为出色。
四、游戏实测
这次的游戏实测稍微有点不同,虽然 NVIDIA 官方宣称首批支持 DLSS 4 的游戏高达 75 款,不过目前要想在游戏中顺利开启 DLSS 4 相关选项还需要通过 Steam 的测试版通道激活,所以多数主流游戏我们依旧测试的是 DLSS 3 和帧生成的表现,并在最后以《赛博朋克:2077》这款游戏单独为大家呈现 DLSS 4 技术的实际表现。
1、《CS2》
2022 年 RTX 4090 首测那会儿还没有《CS2》,后续推出的《CS2》相较于《CS:GO》性能压力大了不少,不过即便如此七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡依旧在 4K 分辨率 + 高画质下跑出了 431 分的游戏平均帧数,1% Low 帧也有 189 帧。
而在 2K 分辨率 + 高画质下则跑到了平均 635 帧的游戏帧数,1% Low 帧提升到 240 帧,完全不会影响游戏发挥。
2、《漫威争锋》
竞技游戏这边,我们还挑选了最近比较火的《漫威争锋》,《漫威争锋》目前支持了 DLSS 和帧生成技术,我们测试了关闭和打开 DLSS 选项前后的表现:
在 4K 分辨率 + 高画质下,游戏平均帧数 179 帧,1% Low 帧 146 帧,游戏平均延迟 23ms;
在 4K 分辨率 + 高画质 + DLSS 质量档 + 帧生成 / 低延迟下,游戏平均帧数 283 帧,1% Low 帧 172 帧,游戏平均延迟 17ms;
这其中 1% Low 帧提升达到了 17.8%,延迟降低了 5ms,游戏平均帧数提升接近 100 帧。
3、《无限暖暖》
接下来是两款端游,首先是《无限暖暖》,这款游戏对硬件资源的开销非常大,完全不输 3A 大作。
在 4K 分辨率 + 极致画质 + 上采样抗锯齿下,游戏平均帧数为 171 帧,1% Low 帧 133 帧;
在 4K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 161 帧,1% Low 帧 117 帧;
对比 RTX 4090 平均 100 帧左右的游戏帧数,1% Low 帧超过了其上代平均帧数,游戏明显更加流畅,操作也更加跟手了。
在 2K 分辨率 + 极致画质 + 上采样抗锯齿下,游戏平均帧数为 230 帧,1% Low 帧 137 帧;
在 2K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 195 帧,1% Low 帧 151 帧;
来到 2K 分辨率下值得注意的是,1% Low 帧的提升在上采样抗锯齿下几乎没有提升,但开启 DLSS 抗锯齿后,1% Low 帧提升了 34 帧。
4、《崩坏:星穹铁道》
《崩坏:星穹铁道》在端游中也比较吃配置,最近更新游戏后支持了 DLSS 功能,我们也进行了简单测试。在 4K 分辨率 + 最高画质 + DLSS 质量 + 渲染精度 1.0 + 垂直同步的设置下,进行匹诺康尼-黄金的时刻跑图,游戏平均帧数可以顶满 4K / 240 帧,1% Low 帧也有 130 帧,完美发挥 4K / 240Hz 显示器的功力,游戏体验非常舒适。
5、《古墓丽影:暗影》
传统光栅单机游戏可以考察一下 RTX 5090 D 在非光追和 DLSS 时的性能表现:
在 4K 分辨率 + 最高画质下,游戏平均帧数为 249 帧;
在 2K 分辨率 + 极致画质下,游戏平均帧数为 372 帧;
相比上一代 RTX 4090,4K 和 2K 分辨率下的游戏平均帧数提升分别达到了 36% 和 46%。
6、《极限竞速:地平线 5》
《极限竞速:地平线 5》有着较为出色的优化:
在 4K 分辨率 + 极端画质下,游戏平均帧数为 199 帧,1% Low 帧 103 帧;
在 2K 分辨率 + 极端画质下,游戏平均帧数为 254 帧,1% Low 帧 106 帧;
相比上一代 RTX 4090,4K 和 2K 分辨率下的游戏平均帧数提升分别达到了 27.5% 和 38%。
7、《孤岛惊魂 6》
接下来就是光追游戏了,首先是《孤岛惊魂 6》,它对 CPU 的单核性能要求也很高,支持光追和 DLSS。经过实测:
在 4K 分辨率 + 极高画质下,游戏平均帧数为 195 帧,1% Low 帧 82 帧;
在 4K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 168 帧,1% Low 帧 88 帧;
相比上一代 RTX 4090,4K 默认和 4K 光追下的游戏平均帧数提升分别达到了 47.7% 和 47.3%,提升幅度接近 50%。
在 4K 分辨率 + 极高画质下,游戏平均帧数为 243 帧,1% Low 帧 125 帧;
在 4K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 205 帧,1% Low 帧 105 帧;
相比上一代 RTX 4090,4K 默认和 4K 光追下的游戏平均帧数提升分别达到了 41.2% 和 52.9%。
8、《黑神话:悟空》
在测试绕不开的“众生平等”之作《黑神话:悟空》中,由于 4K 分辨率 + 超高全景光追的压力巨大,强如 RTX 5090 D 也只能跑到 30 帧,这里就不单独做比较了。经过实测:
4K 分辨率 + 影视级画质 + 50% 超采样分辨率下,游戏平均帧数为 103 帧;
4K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 134 帧;
可以看到在 RTX 5090 D 的加持下,4K 分辨率 + 影视级画质的黑猴也能达到 100 帧以上的游戏平均帧数,体验提升巨大。
在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率下,游戏平均帧数为 115 帧;
在 2K 分辨率 + 影视级画质 + 50% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 181 帧;
9、《真三国无双:起源》
最后我们再测一款刚发售不久的游戏《真三国无双:起源》,它恰好就在首批支持 DLSS 4 技术的 75 款游戏当中,可惜目前游戏还未激活 DLSS 4 选项开关,只能看看它在 DLSS 3 下的表现了。
在 4K 分辨率 + 最高画质,游戏平均帧数为 237 帧,1% Low 帧为 130 帧;
在 4K 分辨率 + 最高画质 + DLSS 质量 + 帧生成,游戏平均帧数为 332 帧,1% Low 帧 160 帧;
作为一款优化非常出色的游戏,RTX 5090 D 在 4K 分辨率下不开光追和 DLSS 选项,都能得到接近 240 帧的平均帧数,无双割草的体验感拉满。
在公布 2K 分辨率游戏帧数之前,需要注意的是游戏目前支持的最高帧数只有 480 帧。
在 2K 分辨率 + 最高画质,游戏平均帧数为 240 帧,1% Low 帧为 154 帧;
在 2K 分辨率 + 最高画质 + DLSS 质量 + 帧生成,游戏平均帧数为 435 帧,1% Low 帧 207 帧;
虽然开启光追 + DLSS + 帧生成也没有顶满 480 帧,但 1% Low 帧都有 200 帧以上,使用 RTX 5090 D 的无双割草体验绝对差不了,后续支持 DLSS 4 体验有多爽我都不敢想。
五、DLSS 4 游戏体验
目前 RTX 40 系列已经支持的 DLSS 3 技术实际效果已经非常强大了,DLSS 4 在 DLSS 3 的技术上,再次提升了帧生成的性能潜力,运用全新的多帧生成技术,结合第五代 Tensor Core 的强大性能,利用 AI 为每个渲染帧生成至多 3 个额外帧,从而大幅提升游戏的 FPS 水平。
DLSS 4 配合全套 DLSS 技术,包括光线重建、超分辨率以及 DLAA 等功能,最多可实现传统图像渲染的 8 倍帧率。拥有 DLSS 4 技术的游戏,玩家使用 RTX 5090 D 可轻松解锁 4K 240 FPS 全景光追的满血性能体验。
多帧生成技术还可配合 NVIDIA Reflex 低延迟技术保持较低的游戏延迟,让游戏的操作和响应影响很小。毕竟 GPU 为每个渲染帧计算时,都设计到超分辨率、光线重建和多帧生成等多维度,延迟的增加不可避免。不过,GeForce RTX 50 系列的第 5 代 Tensor Core 在 AI 处理性能上提升了 2.5 倍,因此游戏的延迟变化很小,具体我们将在下面的游戏实例中为大家演示。
Blackwell 显示引擎也在 DLSS 4 技术发挥了重要作用,通过提升其像素处理能力,让游戏在更高分辨率和刷新率下满足 DLSS 4 技术的要求,最高可提升 1 倍的像素处理能力。
DLSS 4 技术还带来了模型架构的重大升级,DLSS 光线重建、DLSS 超分辨率和 DLAA 特性均由首个实时 Transformer 模型驱动,并用来提升生成像素的质量,它支持通过自注意力操作评估整个帧几多个帧中每个像素的重要程度,更好理解场景关系,让生成的像素具有更好稳定性、更少的伪影、更丰富的运动细节和平滑边缘。
官方表示,目前已有超过 75 款支持 DLSS 帧生成技术的游戏和应用可在 GeForce RTX 50 系列 GPU 上升级至 DLSS 多帧生成技术,不少主流 3A 大作也将于 50 系显卡正式发售后不久体验到 DLSS 4,包括《心灵杀手 2》、《夺宝奇兵:古老之圈》、《真三国无双:起源》、《黑神话:悟空》、《星球大战:亡命之徒》《寂静岭 2:重制版》等热门作品。
《赛博朋克:2077》目前的 steam 测试版已支持 DLSS 4,我们通过它来了解下 DLSS 4 的实际体验好了。如果在 4K 分辨率下开启光追,但不开启 DLSS 和帧生成选项,那么:
在 4K 分辨率超级光追画质下,游戏平均帧数为 60 帧;
在 4K 分辨率超速光追画质下,游戏平均帧数为 35 帧;
即使是 RTX 5090 D 面对 4K 分辨率 + 光线追踪条件下硬刚物理图形性能,压力依旧非常大,超级光追尚可跑到 60 帧的流畅基准线,超速光追(路径光追)就力不从心了。
如果是 4K 分辨率 + 超级画质,不开光追和 DLSS,游戏平均帧数的表现还可以,能达到 116 帧,大家先记一下这个数字。
接着我们看下多帧生成的选项,打开帧生成选项后,下面多出了一个多帧生成的倍率选择项,即 DLSS Multi Frame Generation,可选择 2x、3x 和 4x 这 3 种生成倍率。
我们依次在 4K 分辨率 + 超级光追画质 + DLSS 性能设置下,选择 2x、3x 和 4x 多帧生成,运行游戏基准测试,分别得到了 217 帧、302 帧和 379 帧的游戏平均帧数,2x 和 3x 多帧生成的表现,非常接近 116 帧的 2 倍和 3 倍帧数,而 4K 分辨率下的 4x 多帧生成所带来的 379 帧则更加恐怖如斯。
当我们进一步切换到超速光追画质 + DLSS 4 多帧生成 4x 时,游戏平均帧数也有 295 帧。万万没想到,在当下最吃性能的一款 3A 游戏上,我们跑出了前所未有的游戏性能,可以说 DLSS 4 技术彻底颠覆了大家对于游戏性能的认知。
当然,无论是何种形式的插帧,延迟的增加都不可避免,所以我们也实测了关闭和打开多帧生成后的延迟表现。
在关闭帧生成选项的情况下,同一场景下 4K 超级画质和 4K 超级光追画质的游戏平均延迟分别为 15ms 和 18ms。
而切换到超速光追画质后,依旧在同一场景下分别开启 2x、3x 和 4x 多帧生成,游戏平均延迟分别为 21ms、24ms 和 27ms。
如此看来相比开启帧生成之前,延迟的确有一定的增加,但幅度非常小。超速光追 + 2x 多帧生成对比超级光追无帧生成仅增加了 3ms,随后的 3x 和 4x 多帧生成延迟依次递增 3ms,总体延迟都控制在 30ms 以内,对于非竞技类单机游戏来说这个表现完全可以接受。
除了 DLSS 4 技术外,新一代 NVIDIA Reflex 2 低延迟技术也可进一步降低游戏的延迟表现,提升操作手感和响应速度。过去四年里,NVIDIA Reflex 已集成到超过 100 款游戏中,可以将 PC 延迟降低 50%。新的 Reflex 2 将采用一项 Reflex Frame Warp 技术,通过把最新的鼠标输入指令及时同步给渲染帧,实时刷新和控制渲染出的游戏帧,可以说是定制化的低延迟调整了。
NVIDIA Reflex 2 将在未来不仅支持主流竞技游戏和动作游戏,如《无畏契约》等。相信通过这一技术,开启 DLSS 4 之后的游戏低延迟表现会更加出色。
六、总结
本次首测七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡的过程令人印象深刻,尤其是第五代 Tensor Core 和 DLSS 4 加持下的游戏性能表现,成倍的游戏帧数增加变得唾手可得,而实际体验中的延迟增加和画质损失代价完全可以接受。今后,显卡的游戏性能也将迈入一个新的时代,无论是玩家还是游戏开发者都将受益于 DLSS 4 技术。
另一方面,七彩虹 iGame GeForce RTX 5090 D Vulcan OC 32GB 火神显卡的设计和丰富的配件玩法也令人印象深刻,设计上除了继承上代赛博硬核科幻风的风格外,恰到好处的搭配和质感也相当高级,拿到手有种轻奢相机的感觉,配合副屏 + 灯光组件 + 多样灯效 + 自定义图案非常个性,无愧旗舰显卡之名。
七彩虹后续也将推出白火神版本,喜欢火神系列设计、预算充足的朋友可以闭眼入。据官方透露,1 月 30 日这款显卡将在七彩虹官网商城、各大电商平台及全国授权零售经销渠道开售。除了火神,七彩虹还同时准备了 iGame Neptune、Advanced 等多个不同系列的 GeForce RTX 5090 D 显卡供玩家选购,售价 16499 元起。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。