在 CES 2025 大展上,英伟达推出了基于 Blackwell 架构的 GeForce RTX 50 系列游戏显卡。IT 之家已经拿到了技嘉 GeForce RTX 5080 GAMING OC 16G。这款显卡采用了全新一代的 Blackwell 架构,配备了 GDDR7 256Bit 显存,容量高达 16GB,支持 DLSS 4 技术,能在很大程度上提升游戏帧率。另外,其配备的风之力散热系统相比于公版解热性能更好,可以充分发挥 RTX 5080 的全部实力。
为了释放技嘉 RTX 5080 魔鹰的全部性能,本次测试平台具体配置如下:
一、外观设计
技嘉 GeForce RTX 5080 GAMING OC 16G 采用全黑设计,其风之力散热系统拥有三枚大尺寸的仿生散热风扇。其设计灵感来源于鹰的翅膀,形态更加符合空气动力学,有效降低了风阻和噪音,在低噪音表现的同时,可将风压提升高达 53.6%,风量提升 12.5%。
技嘉魔鹰 RTX 5080 背部采用大面积镂空设计,透过格栅可以看到风之力散热系统大面积的散热鳍片,背部黑色的线条涂装也使得显卡透露着满满的黑科技。
体积方面经过IT之家实测,技嘉魔鹰 RTX 5080 显卡的三围分别是 330*128*69mm(不含金手指与挡片),裸卡重量约 1.84kg。
技嘉魔鹰 RTX 5080 的右侧预留的显卡安装支架的三个孔位,安装时用两个即可固定住显卡。
技嘉魔鹰 RTX 5080 的顶部为大面积散热鳍片,左侧印有 GEFORCE RTX LOGO 右侧则是支持滑动的 GIGABYTE 的 LOGO,可透过 RGB 灯条发光。
技嘉魔鹰 RTX 5080 的供电接口具备指示灯提示功能,若是指示灯熄灭就是电源线连接正常状态,若是亮起则是电源线未连接,若是闪烁则是电源异常。这样设计的好处是可以避免电源连接不良或是忘记接电源的造成显卡故障。
技嘉魔鹰 RTX 5080 除了一根转 3*8pin 电源转接线外,还附送了显卡支架,支架支撑部分有两种尺寸可以安装,以适配不同的机箱。
技嘉 GeForce RTX 5080 GAMING OC 16G 的 I/O 金属挡板上,配备了 3 个 DP2.1b 接口和 1 个 HDMI2.1b 接口,支持最高 8K / 165Hz 输出。
二、技术解析
NVIDIA GeForce RTX 5080 搭载了全新的 Blackwell 架构,其在游戏性能与 AI 性能方面均有大幅提升。英伟达认为当下人们对画面质量的追求,其所需的运算性能已远超摩尔定律所能提供的范畴。在此情形下,引入神经网络渲染技术以提高帧率才能满足人们对于画质与帧率的高需求。
得益于神经网络渲染的融入,Blackwell 的多单元流处理器(SM)实现了处理吞吐量的提升,并且与 Tensor Core 的结合更为紧密,这一优化有效提升了神经网络着色器的性能表现。
为确保下一代 DLSS 多帧生成技术下帧率的稳定性,Blackwell 架构特别配备了基于硬件的 Flip Metering。这一技术将帧率逻辑转移至显示引擎内,使 GPU 能够更精准地把控显示时间。不仅如此,显示引擎的像素处理能力也得到了翻倍增强,从而能够更好地支持更高的分辨率与刷新率,充分释放 DLSS 4 的性能潜力。
第五代 Tensor Core 支持 FP4 浮点运算精度,这种低量化方法类似文件压缩,能减少模型推理的数据存储与计算量,提升计算效率,显存使用不到 FP16 的一半,却可让 GPU 性能提升 2 倍。
RT Core 提升了光线、路径与三角形相交的检测效能,能对大量几何图形细节光线追踪。在新一代 Blackwell 架构下,检测效率是上一代的 2 倍、初代 Turing 架构的 8 倍,还通过增强压缩减少 25% 内存占用,大幅提升光线追踪细节。
Blackwell 架构 GPU 搭载 GDDR7 显存,采用 PAM3 信号编码机制,与 GDDR6、GDDR6X 不同,每两周期传输 3 位数据,更省电且带宽提升,速度达 30Gbps。
具体到产品规格上,技嘉 GeForce RTX 5080 GAMING OC 16G 基于最新一代 GB200-400-A1 核心和 TSMC 4N 架构制程工艺打造,内有 10752 个 CUDA 核心、336 个 Tensor 核心、84 个光追核心、336 个纹理单元、128 个 ROP 单元,核心规模相比 RTX 4080 提升约为 10.5%,单元内的 SM 和 TPC 群组数量也均有增加。GeForce RTX 5080 的核心频率范围是 2.3Hz-2.62GHz。显存方面升级为 256-bit 16GB GDDR7,带宽来到了 960GB/s。TGP 功耗为 360W,相比上代 RTX 4080 增加了 40W。
三、理论跑分
作为一款高端显卡,GeForce RTX 5080 有着怎么的性能与性能释放呢?接下来就进入理论测试环节。先看烤机,单烤甜甜圈 10 分钟,GPU 的核心温度稳定在 63.5℃左右,要比公版的 73.4°C 低很多,显卡频率 2600MHz,整张显卡的功率在 360W 左右,与英伟达官方的 TGP 保持一致。搭配 i7 / i9 或锐龙 7、锐龙 9 这样的高端处理器,1000W 的电源足矣。
在 3DMark Time Spy DX12 测试中,技嘉 GeForce RTX 5080 GAMING OC 16G 分数达到了 33159 分,比公版的 32022 要高出一千多分。作为对比 GeForce RTX 4080s 公版的分数为 29220 分,提升约为 13%,提升幅度较大。
而在 3D Mark Time Spy Extreme DX12 测试中,技嘉 GeForce RTX 5080 GAMING OC 16G 分数达到了 16448 分,作为对比 RTX 4080s 公版的分数为 14541 分,提升幅度同样为 13%。
在 3DMark Portal Royal 实时光追测试中,技嘉 GeForce RTX 5080 GAMING OC 16G 的综合分为 22587 分,作为对比 RTX 5080 公版为 22060 分,RTX 4080s 公版的分数为 18439 分,提升幅度达到了 22%。
通过 3D Mark 一系列的显卡测试项目跑分不难发现,技嘉 GeForce RTX 5080 GAMING OC 16G 的图形性能相比公版 RTX 5080 有略微提升,相比 RTX 4080s 各项测试有着 13%-22% 左右的提升幅度。
四、游戏实测
这次的游戏实测稍微有点不同,虽然 NVIDIA 官方宣称首批支持 DLSS 4 的游戏高达 75 款,不过目前要想在游戏中顺利开启 DLSS 4 相关选项还需要通过 Steam 的测试版通道激活,所以多数主流游戏我们依旧测试的是 DLSS 3 和帧生成的表现,并在最后以《赛博朋克:2077》这款游戏单独为大家呈现 DLSS 4 技术的实际表现。
1、《CS2》
首先是《CS2》,这款游戏相较于《CS:GO》性能压力大了不少,不过即便如此技嘉 GeForce RTX 5080 GAMING OC 16G 依旧在 4K 分辨率 + 高画质下跑出了 298 分的游戏平均帧数,1% Low 帧也有 137.6 帧。
而在 2K 分辨率 + 高画质下则跑到了平均 490.8 帧的游戏帧数,1% Low 帧提升到 235.8 帧,完全不会影响游戏发挥。
2、《永劫无间》
竞技游戏我们选择测试的是《永劫无间》和《漫威争锋》,《永劫无间》目前支持了 DLSS 和帧生成技术,我们打开 DLSS 选项前后 4K 与 2K 的帧率表现。在 4K 分辨率 + 高画质 + DLSS 质量档 + 帧生成 / 低延迟下,游戏平均帧数 148 帧,1% Low 帧 100 帧,游戏平均延迟 28ms;
在 2K 分辨率 + 高画质 + DLSS 质量档 + 帧生成 / 低延迟下,游戏平均帧数 217 帧,游戏平均延迟 20ms;
3、《无限暖暖》
接下来是两款端游,首先是“优化出色”的《无限暖暖》,这款游戏开启光追后对硬件资源的开销非常大,完全不输 3A 大作。
在 4K 分辨率 + 极致画质 + 上采样抗锯齿下,游戏平均帧数为 114 帧,1% Low 帧 92 帧;
在 4K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 107 帧,1% Low 帧 80 帧;
整体接近于上一代卡皇 RTX 4090 的游戏帧数,游戏明显更加流畅,操作也更加跟手了。
在 2K 分辨率 + 极致画质 + 上采样抗锯齿下,游戏平均帧数为 159 帧,1% Low 帧 143 帧;
在 2K 分辨率 + 极致画质 + DLSS 抗锯齿下,游戏平均帧数为 155 帧,1% Low 帧 95 帧;
4、《古墓丽影:暗影》
传统光栅单机游戏可以考察一下 RTX 5080 在非光追和 DLSS 时的性能表现:
在 4K 分辨率 + 最高画质下,游戏平均帧数为 152 帧;
在 2K 分辨率 + 最高画质下,游戏平均帧数为 279 帧;
5、《极限竞速:地平线 5》
《极限竞速:地平线 5》有着较为出色的优化:
在 4K 分辨率 + 极端画质下,游戏平均帧数为 157 帧,1% Low 帧 129 帧;
在 2K 分辨率 + 极端画质下,游戏平均帧数为 212 帧,1% Low 帧 149 帧;
相比公版 RTX 4080s,4K 和 2K 分辨率下的游戏平均帧数提升分别达到了 23% 和 42%。
6、《孤岛惊魂 6》
接下来就是光追游戏了,首先是《孤岛惊魂 6》,它对 CPU 的单核性能要求也很高,支持光追和 DLSS。经过实测:
在 4K 分辨率 + 极高画质下,游戏平均帧数为 135 帧,1% Low 帧 121 帧;
在 4K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 118 帧,1% Low 帧 105 帧;
在 2K 分辨率 + 极高画质下,游戏平均帧数为 209 帧,1% Low 帧 191 帧;
在 2K 分辨率 + 极高画质 + 开启光追 + DLSS 质量下,游戏平均帧数为 181 帧,1% Low 帧 164 帧;
7、《黑神话:悟空》
在测试绕不开的“众生平等”之作《黑神话:悟空》中:
4K 分辨率 + 影视级画质 + 30% 超采样分辨率 + 高全景光追,游戏平均帧数为 83 帧;
4K 分辨率 + 影视级画质 + 30% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 126 帧;
可以看到在 RTX 5080 的加持下,4K 分辨率 + 影视级画质的黑猴也能达到 120 帧以上的游戏平均帧数,体验提升巨大。
而切换到 2K 分辨率后:
在 2K 分辨率 + 影视级画质 + 30% 超采样分辨率下,游戏平均帧数为 110 帧;
在 2K 分辨率 + 影视级画质 + 30% 超采样分辨率 + 高全景光追 + 帧生成下,游戏平均帧数为 160 帧;
8、《真三国无双:起源》
最后我们再测一款刚发售不久的游戏《真三国无双:起源》,它恰好就在首批支持 DLSS 4 技术的 75 款游戏当中,可惜目前游戏还未激活 DLSS 4 选项开关,只能看看它在 DLSS 3 下的表现了。
在 4K 分辨率 + 最高画质,游戏平均帧数为 112 帧,1% Low 帧为 83 帧;
在 4K 分辨率 + 最高画质 + DLSS 质量 + 帧生成,游戏平均帧数为 208 帧,1% Low 帧 116 帧;
作为一款优化非常出色的游戏,RTX 5080 在 4K 分辨率下不开光追和 DLSS 选项,都能得到较高帧平均帧数,无双割草的体验感拉满。
五、DLSS 4 游戏体验
其实 RTX 40 系列所支持的 DLSS 3 技术,实际展现出的游戏帧率提升效果就已然十分卓越。而 DLSS 4 技术则是在 DLSS 3 的基础上,进一步挖掘并提升了帧生成的性能潜力。它运用了全新的多帧生成技术,借助第五代 Tensor Core 的强劲性能,通过 AI 技术,能够为每一个渲染帧生成多达 3 个额外的帧,进而显著提升游戏的 FPS。
DLSS 4 可以与光线重建、超分辨率以及 DLAA 等一系列 DLSS 技术协同工作,最高可使游戏帧率达到传统图像渲染方式的 8 倍。当玩家在游戏中启用 DLSS 4 技术,搭配 RTX 5080 显卡,便能够轻松实现开启全景光线追踪的 4K 分辨率高帧率游戏体验。
GeForce RTX 50 系列的第 5 代 Tensor Core,AI 处理性能相比前代提升 2.5 倍,极大抑制游戏延迟增长,后续游戏实例将演示延迟实际变化。Blackwell 显示引擎也对 DLSS 4 技术有着重要意义,能提升像素处理能力,助力游戏在高分辨率和刷新率下适配 DLSS 4 技术,最高可使像素处理能力翻倍。
DLSS 4 技术实现了模型架构的重大革新。DLSS 光线重建、DLSS 超分辨率以及 DLAA 这些特性,均由首个实时 Transformer 模型驱动,该模型旨在提升生成像素的质量。它能够借助自注意力操作,对一帧或多帧画面中的每个像素的重要程度进行评估,从而更好地理解场景中的各种关系。通过这种方式,生成的像素稳定性更佳,伪影更少,同时在运动细节的呈现上更为丰富,边缘也更加平滑。
英伟达宣称,当下已有超 75 款支持 DLSS 帧生成技术的游戏与应用,在 GeForce RTX 50 系列 GPU 上可升级为 DLSS 多帧生成技术。50 系显卡正式发售后不久,众多主流 3A 大作也将适配 DLSS 4,其中涵盖《心灵杀手 2》《夺宝奇兵:古老之圈》《真三国无双:起源》《黑神话:悟空》《星球大战:亡命之徒》以及《寂静岭 2:重制版》等热门游戏。
《赛博朋克:2077》目前的 steam 测试版已支持 DLSS 4,我们通过它来了解下 DLSS 4 的实际体验。如果是 4K 分辨率 + 超级画质,不开光追和 DLSS,游戏平均帧数的表现还可以,能达到 73.27 帧。
接着我们看下多帧生成的选项,打开帧生成选项后,下面多出了一个多帧生成的倍率选择项,即 DLSS Multi Frame Generation,可选择 2x、3x 和 4x 这 3 种生成倍率。
我们依次在 4K 分辨率 + 超级光追画质 + DLSS 性能设置下,选择 2x、3x 和 4x 多帧生成,运行游戏基准测试,分别得到了 149.49 帧、206.15 帧和 255..69 帧的游戏平均帧数,2x 和 3x 多帧生成的表现,非常接近 71.25 帧的 2 倍和 3 倍帧数,在 4K 分辨率下超 240 帧的超级光追画质体验远超我们的预期,画面流畅度极高。
当我们进一步切换到超速光追画质 + DLSS 4 多帧生成时,游戏平均帧数分别也有 106.3 帧、150.81 帧、189.68 帧。对于硬件性能要求极高的一款 3A 游戏中,我们竟获得了前所未有的游戏性能体验。不得不说,DLSS 4 技术的出现,完全打破了大家以往对游戏性能的固有认知。
当然,无论是何种形式的插帧,延迟的增加都不可避免,所以我们也实测了关闭和打开多帧生成后的延迟表现。在关闭帧生成选项的情况下,我们测试 4K 超速光追画质的游戏平均延为 33ms。依旧在同一场景下分别开启 2x、3x 和 4x 多帧生成,游戏平均延迟分别为 41ms、44ms 和 49ms。
如此看来相比开启帧生成之前,延迟的确有一定的增加。不过随后的 3x 和 4x 多帧生成延迟依次递增 3ms、5ms,总体延迟都控制在 50ms 以内,对于非竞技类单机游戏来说这个表现完全可以接受。
针对目前 DLSS 4 适配游戏较少的问题,英伟达推出了 DLSS Override 功能进行缓解,这个功能能让支持 DLSS 且还没有适配 DLSS 4 的游戏获得 DLSS 4 的帧生成和超分体验。
我们以《漫威争锋》为例,在 4K 分辨率 + 高画质 + 关闭 DLSS 情况下,游戏平均帧数 155 帧,1% Low 帧 63 帧,游戏平均延迟 15ms;
在 4K 分辨率 + 高画质 + DLSS 质量档,游戏平均帧数 185 帧,1% Low 帧 107 帧,游戏平均延迟 25ms;
在同样情境下,启用 DLSS Override,并将 DLSS 4 帧生成设置为 X4 后,游戏平均帧数 372 帧,1% Low 帧 206 帧,游戏平均延迟 22ms。游戏帧率得到大幅度提升,体验和原生适配 DLSS 4 已经很接近了。
除 DLSS 4 技术外,新一代 NVIDIA Reflex 2 低延迟技术进一步降低游戏延迟,提升操作手感与响应速度。过去四年,NVIDIA Reflex 已集成超 100 款游戏,能将 PC 延迟降低 50%。新 Reflex 2 采用 Reflex Frame Warp 技术,通过同步鼠标输入指令与渲染帧,实时控制游戏帧,实现定制化低延迟调整。未来,NVIDIA Reflex 2 不仅支持《无畏契约》等主流竞技、动作游戏,搭配 DLSS 4,游戏低延迟表现将更出色。
六、生产力
生产力方面,IT之家实测了 UL Procyon 的照片编辑、视频剪辑、以及 AI 文本撰写等性能。在照片编辑上,技嘉魔鹰 RTX 5080 配合 AMD 9800X3D 获得了 9369 分比公版 RTX 5080 高了 683 分。
在视频剪辑性能测试中我们开启了 GPU 加速,得益于 RTX 5080 Blackwell 架构的第九代 NVENC,其在 H.264 / H.265 4:2:2 编码的 8 位和 10 位视频上有着非常大的优势,技嘉魔鹰 RTX 5080 最终获得了 63208 分,比公版 RTX 5080 高了 575 分。
最后是考验 AI 性能的大语言模型测试,面对 13B 参数量的 LLAMA 2 模型平均 OTS 也有着 84.49tokens / s,相比于公版 RTX 5080 的 83.48tokens / s 有所提升,表现出色。
七、总结
在这次对技嘉 GeForce RTX 5080 GAMING OC 16G 的首次测试中,我们获得了极为深刻的印象。特别是在第五代 Tensor Core 与 DLSS 4 技术的双重助力下,游戏性能的提升十分显著,游戏帧数成倍增长变得轻而易举。并且,其风之力散热系统的表现也极为出色,技嘉魔鹰 RTX 5080 搭配新一代仿生风扇,有效降低了风阻和噪音,其在低噪音表现的同时,可将风压提升高达 53.6%,风量提升 12.5%,升级导热凝胶,
大型均热板和复合式热管、进气格栅等散热技术进一步提升产品散热性能。其性能与散热要优于公版 RTX 5080。关于技嘉 GeForce RTX 5080 GAMING OC 16G 售价到小编截稿时还是未定状态。除此之外,技嘉也同步推出了技嘉 GeForce RTX 5080 SFF 风魔 OC 显卡,这款显卡同样搭载新一代仿生风扇,同时满足 NVIDIA SFF-Ready 标准,更适合小尺寸机箱用户使用,这款显卡售价 8299 元,也与今天同步开售。
DLSS 4 技术的应用,将为显卡游戏性能开启全新篇章。一方面,广大玩家将迎来更流畅、精彩的游戏体验;另一方面,游戏开发者也获得了更广阔的创作天地,能够打造出画面更精美、运行更流畅的游戏作品。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。