华为昇腾910C:国产AI芯片惊艳亮相,性能超越NVIDIA H100 60%,刷新行业认知
2月5日的消息称,尽管DeepSeek未公开其硬件配置的具体细节,但普遍认为其采用了大量NVIDIA的AI芯片,包括H100、H800和H20等多种型号。而最近的爆料显示,DeepSeek还对华为最新的AI芯片——昇腾910C进行了测试验证。
昇腾910C据报在2024年末开始向若干客户进行大规模供货,其中包括阿里巴巴、百度、腾讯等大企业,首批数量约为7万颗,每颗价格大约为2万元。
消息显示,昇腾910C采用了中芯国际的7nm工艺制造,chiplets双芯片整合封装,晶体管数量达530亿个,整体国产化率已达55%左右。
它可以平替NVIDIA H100,同样用于大规模的AI训练和推理,FP8、FP16、FP32、FP64等不同数据类型下均有不俗表现。
昇腾910C
按照最新说法,DeepSeek团队的实测数据显示,华为昇腾910C在AI推理中的表现出乎意料地好,已经达到NVIDIA H100芯片的60%左右。
更进一步地,通过手写CUNN内核和优化,昇腾910C的性能还可以进一步提升。
据称,DeepSeek自成立之初便兼容了华为昇腾芯片,并且自主维护着PyTorch仓库。仅需一行代码即可实现CUDA到CUNN的转换,这不仅简化了开发流程,还为性能优化提供了广阔的空间。通过深度定制和优化,可以进一步挖掘其潜在的高性能表现。 这种技术上的突破无疑为开发者们带来了极大的便利,同时也展示了DeepSeek在技术创新方面的强大实力。能够自主维护PyTorch仓库意味着他们对底层技术有着深入的理解和掌控力,这对于推动整个AI领域的发展具有重要意义。此外,简化从CUDA到CUNN的转换过程,不仅降低了技术门槛,也为更多的开发者和研究者提供了便捷,有助于加速人工智能技术的应用与普及。
然而需要注意的是,目前了解到的情况是昇腾910在AI推理性能方面表现优异,但其AI训练性能可能仍然不够理想。
昇腾910