IT之家 3 月 4 日消息,科技媒体 Tom's Hardware 今天(3 月 4 日)发布博文,报道称英伟达新一代 GeForce RTX 5090、RTX 5080 和 RTX 5070 Ti 显卡计算性能低下的一个重要原因,是英伟达在其“Blackwell”架构中悄然停止了对 32 位 OpenCL 和 CUDA 的支持,导致与现有测试工具和应用程序存在兼容性问题。
IT之家援引博文介绍,PassMark Software 针对英伟达 RTX 50 系列显卡进行 Direct Compute 基准测试时,发现返回了错误代码“CL_OUT_OF_RESOURCES (-5)”,且部分包含 32 位代码的模块表现低迷。
随后调查发现在 RTX 50 系列 GPU 上,32 位 CUDA 应用程序无法直接运行,需依赖 CPU 处理,导致性能大幅下降。
该团队经过调查,尽管基准测试的主要应用程序多年来一直是 64 位,但部分计算子测试仍使用 32 位代码,这些代码在 RTX 4000 及更早的显卡上运行正常。
NVIDIA 并非突然终止 32 位 CUDA 支持,而是通过多次更新逐步淘汰。PassMark 团队推测,这一问题可能通过 32 位到 64 位的翻译层解决,但英伟达并未提供官方解决方案。
PassMark 还指出,这一变化并不能完全解释 DirectX9 性能不佳的原因,暗示可能有其他架构变化影响了旧版渲染路径。尽管 PassMark 已更新其软件,但旧版基准测试可能仍会受到影响。
对于开发者而言,将旧版代码迁移至 64 位环境,可能涉及大量底层操作和内存管理的修改,但大多数开发者已逐步转向 64 位代码。
PassMark 目前正在将受影响的 OpenCL 代码移植到 64 位,以便正确测试新显卡的计算能力。不过该团队也警告称,在不修改源代码之前,许多包含 32 位 OpenCL 组件的现有应用程序,可能永远无法在 RTX 50 系列显卡上正常运行。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。