设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

回归 Pascal:英伟达 RTX 50 显卡全部 CUDA 核心支持 FP32 / INT32 双功能

2025/2/1 13:27:28 来源:IT之家 作者:溯波(实习) 责编:溯波

IT之家 2 月 1 日消息,英伟达现已公布 Blackwell GPU 架构白皮书,披露了 GeForce RTX 50 系列显卡的大量技术细节,其中相当值得注意的一点是 Blackwell 架构的全部单精度 CUDA 核心同时支持 FP32 / INT32 数据,这点上回归了九年前的 Pascal 架构。

▲ Blackwell 架构 SM 设计

▲ Pascal 架构 SM 设计

英伟达在 GeForce 10 "Pascal" 世代仍采用单精度 CUDA 单元兼顾 FP32 / INT32 的设计,而在 Volta 和 Turing 两代上换用了两组 1:1 比例的 CUDA 核心分别承担 INT32 和 FP32 的方案

▲ Volta(左)、Turing(右)两代架构 SM 设计

来到 Ampere 架构,英伟达则为每个 SM 流式处理器的四个处理块(IT之家注:Processing Block)之一提供了 1 组 16 个 FP32 / INT32 单元和 1 组 16 个纯 FP32 单元;而在 Ada GPU 上,这一设计得到延续。

▲ Ampere(左)、Ada(右)两代架构 SM 设计

Blackwell 架构上的统一 CUDA 使得每 SM 可能的 INT32 整数运算能力较 Ada 翻倍。不过在任何给定的时钟周期内,Blackwell 统一内核只能以 FP32 或 INT32 模式中的一种运行。

英伟达提到,Ada 架构 SM 是为标准着色器设计和优化的,而 Blackwell SM 则是为神经着色器设计和优化的

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:英伟达RTX50Blackwell显卡

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知