RTX神经纹理压缩技术:显存利用率暴跌至96%,革新显卡性能!
2月9日消息,YouTube频道Compusemble对英伟达的RTX神经纹理压缩(NTC)技术进行了详细的基准测试,结果表明该技术在实际3D工作负载中展现出了卓越的能力。测试结果显示,与传统的纹理压缩技术相比,RTX NTC技术能够显著地将纹理内存大小减少96%。 这项技术的进步无疑为游戏开发者和3D艺术家们带来了福音。它不仅能够极大地优化内存使用,还可能带来更高的性能表现和更流畅的工作流程。随着这项技术的普及,我们有望看到更多高质量的游戏和视觉效果,同时也能期待未来3D内容创作领域会有更多的创新和突破。
注意到,最近我们对Compusemble在RTX 4090显卡上的性能进行了测试,特别关注了它在1440p和4K分辨率下使用NTC技术的表现。测试包括两种模式:“NTC转码为BCn”和“样本推理”。在“NTC转码为BCn”模式中,所有的纹理在加载时都会被转换为BCn格式,这样可以显著提升游戏中的加载速度和运行效率。而在“样本推理”模式下,系统只会对渲染特定视图所需的单个texel进行解压缩处理,从而进一步优化了纹理内存的使用,使得在高分辨率下的性能表现更加出色。 这种技术的应用无疑为未来的图形处理开辟了新的道路。通过这种方式,即使是在4K这样的超高分辨率下,也能保持流畅的游戏体验和较低的资源占用率。这不仅提升了玩家的游戏体验,也预示着显卡和相关技术在未来的发展方向,可能会进一步推动游戏开发和硬件性能的进步。
在1440p分辨率下,当启用DLSS超分功能时,“NTC转码为BCn”模式将测试应用的纹理内存占用从272MB降低至98MB,减少了64%。而“样本推理”模式则将纹理大小降至仅11.37MB,与非神经压缩技术相比,内存占用减少了95.8%,与之前的神经压缩模式相比减少了88%。
不过,启用RTX神经纹理压缩技术后,性能会受到一定影响。尽管如此,由于测试使用的是上一代RTX4090显卡,而非最新的RTX5090显卡,因此随着新一代架构的引入,性能损失有望得到缓解。
在“NTC转码为BCn”模式下,平均FPS与未启用NTC时相比几乎没有变化,这表明该模式在提升图像处理效果的同时,并没有对整体性能产生显著影响。然而,“样本推理”模式下的性能下降则更为明显,FPS从1600多帧降至1500多帧,甚至1%的低值也大幅降至840帧左右。这一现象揭示了不同算法模式在实际应用中的优劣差异,也提示开发者需要在追求高质量图像处理效果的同时,兼顾系统的整体性能表现。 这样的结果不仅反映了技术进步带来的挑战,同时也指出了未来优化的方向。如何在保证图像质量的前提下,进一步提高处理速度,减少性能损耗,将是相关技术领域持续探索的重点。
当采用TAA抗锯齿而非DLSS超分技术时,虽然内存容量的消耗与DLSS相似,但GPU的性能表现却有所不同。在TAA模式下,游戏运行速度明显更快,FPS可以接近2000帧。特别是在“样本推理”模式下,即使是在较为苛刻的1%低值测试中,帧数也能达到1300多帧,这比使用DLSS时的840帧有了显著提升。 这种差异表明,在优化游戏体验方面,不同的技术手段会带来截然不同的结果。尽管DLSS在减少内存占用方面有其优势,但TAA在保持高性能的同时还能提供更加流畅的游戏体验,这无疑为玩家提供了更多的选择空间。对于追求极致流畅度的玩家来说,TAA可能是一个更优的选择。同时,这也反映了技术发展中的多样性和灵活性,使得不同需求的用户都能找到适合自己的解决方案。
将分辨率提升至 4K 后,性能显著下降。启用 DLSS 超分功能时,“NTC 转码为 BCn”模式的平均 FPS 在 1100 帧左右,“样本推理”模式的平均 FPS 则略低于 1000 帧,两种模式的 1% 低值都在 500 帧左右。
而关闭 DLSS,改用原生分辨率搭配 TAA 抗锯齿时,“NTC 转码为 BCn”模式的平均 FPS 提升至 1700 帧左右,“样本推理”模式的平均 FPS 在 1500 帧左右。前者的 1% 低值略低于 1100 帧,后者的 1% 低值略低于 800 帧。
此外,我们对Compusemble在4K分辨率下的“样本推理”模式进行了测试,特别关注了协同向量功能的表现。开启协同向量时,平均帧率维持在大约1500帧;而关闭该功能后,平均FPS显著降低到接近650帧。在最低1%帧率方面,开启协同向量时约为750帧,关闭时则为略高于400帧。
根据CompuSemble的基准测试显示,英伟达的神经网络压缩技术可以在显著降低3D应用程序中的纹理内存使用量的同时,以一定的性能损耗为代价,特别是在“采样推理”模式下。
RTX神经纹理压缩技术(RTX NTC)已研发多年,这项创新技术通过现代英伟达GPU中的张量核心进行纹理压缩,取代了传统的块截断编码方法。RTX NTC自1990年代以来,首次对纹理压缩技术进行了重大革新,它能够支持的纹理分辨率高达目前GPU所使用纹理的四倍之多。 这种技术的进步无疑为3D应用和游戏带来了革命性的变化,特别是在视觉效果和性能优化方面。随着游戏画面要求越来越高,高分辨率纹理成为提升视觉体验的关键因素之一。然而,高分辨率纹理也意味着更高的存储需求和加载时间。RTX NTC的出现恰逢其时,它不仅能在不牺牲画质的前提下大幅降低存储需求,还能显著减少加载时间,从而为玩家提供更加流畅的游戏体验。对于开发者来说,这也将极大地减轻资源管理的压力,使他们可以更加专注于游戏的设计与创新。
目前,RTXNTC技术目前仍处于测试阶段,具体发布时间尚未确定。值得注意的是,该技术所需的最低硬件配置似乎并不高。英伟达在其GitHub上的RTXNTC页面明确指出,最低需求为RTX 20系列显卡。此外,该技术已经在GTX 10系列显卡、AMR Radeon RX 6000系列显卡以及Arc A系列显卡上进行了验证,这表明未来该技术有可能在非RTX显卡甚至是游戏主机上得到广泛应用。