全新突破!英伟达 RTX 50 系列双倍加速,CUDA 核心引领未来计算革命!
2月1日消息,英伟达近日发布了Blackwell GPU架构的白皮书,详细介绍了GeForce RTX 50系列显卡的技术细节。值得一提的是,Blackwell架构的所有单精度CUDA核心能够同时处理FP32和INT32数据类型,这一点与九年前的Pascal架构相似。
英伟达在GeForce 10 "Pascal" 系列中仍然使用单一的CUDA单元来同时处理FP32和INT32运算,而在Volta和Turing这两代产品中,则采用了各占一半的CUDA核心分别负责INT32和FP32运算的方案。
在Ampere架构中,英伟达为每个SM流式处理器中的四个处理块之一配备了1组16个FP32/INT32单元和1组16个纯FP32单元;AdaGPU架构延续了这一设计。
Blackwell架构上的统一CUDA使每个SM的潜在INT32整数运算能力相较于Ada架构翻倍。然而,在任意给定的时钟周期内,Blackwell的统一内核只能以FP32或INT32模式之一运行。
英伟达提到,Ada架构SM是为标准着色器量身打造并进行优化的,而BlackwellSM则是针对神经着色器进行设计和优化的。