「揭示性能真相:英伟达 RTX 50 系列显卡挑战 OpenCL 和 CUDA 支持的全新篇章」
3月4日消息,科技媒体Tom'sHardware今日(3月4日)发布文章指出,英伟达新一代GeForce RTX5090、RTX5080和RTX5070Ti显卡在计算性能方面表现不佳的原因之一,是英伟达在其“Blackwell”架构中取消了对32位OpenCL和CUDA的支持,这导致这些显卡与现有的测试工具和应用程序存在兼容性问题。
在对英伟达RTX 50系列显卡进行DirectCompute基准测试时,PassMark Software 发现了一个令人困惑的问题:测试过程中出现了错误代码“CL_OUT_OF_RESOURCES(-5)”。此外,测试还显示,那些包含32位代码的模块在性能上显得有些力不从心。 这一情况引发了业界对于新显卡兼容性和性能稳定性的关注。尽管RTX 50系列在发布初期就备受期待,但此类问题无疑会让人对其实际应用中的表现产生疑问。尤其是对于那些依赖32位代码进行运算的应用程序来说,这可能意味着它们在未来一段时间内仍然需要面对性能瓶颈。希望英伟达能够尽快找到解决方案,以确保用户能够充分利用这些新硬件的潜力。
随后的调查显示,在RTX50系列GPU上,32位CUDA应用程序无法直接运行,必须依赖CPU处理,从而导致了显著的性能下降。这种情况无疑对依赖高性能计算的应用程序开发者提出了新的挑战,他们需要重新评估和调整其软件架构以适应这一限制。此外,这也可能促使硬件制造商加快研发更高效的解决方案,以便更好地支持32位CUDA应用在新一代GPU上的运行。
该团队经过调查,尽管基准测试的主要应用程序多年来一直是 64 位,但部分计算子测试仍使用 32 位代码,这些代码在 RTX 4000 及更早的显卡上运行正常。
NVIDIA 并非突然终止 32 位 CUDA 支持,而是通过多次更新逐步淘汰。PassMark 团队推测,这一问题可能通过 32 位到 64 位的翻译层解决,但英伟达并未提供官方解决方案。
PassMark 还指出,这一变化并不能完全解释 DirectX9 性能不佳的原因,暗示可能有其他架构变化影响了旧版渲染路径。尽管 PassMark 已更新其软件,但旧版基准测试可能仍会受到影响。
对于开发者来说,将旧版代码迁移到64位环境可能需要进行大量的底层操作和内存管理的调整,但大部分开发者已经逐渐过渡到64位代码的开发。
PassMark正在努力将受影响的OpenCL代码迁移到64位架构,以确保能够准确评估新显卡的计算性能。但团队也提醒,如果不调整源代码,很多现有的包含32位OpenCL组件的应用程序可能永远无法在RTX5000系列显卡上正常运行。