首页 > 人工智能 > 人工智能
发布日期:2025-02-05 09:52:42

华为昇腾910C AI推理性能超越NVIDIA H100 60%:国产7nm工艺惊艳亮相,DeepSeek验证实效

华为昇腾910C:国产AI芯片惊艳亮相,性能超越NVIDIA H100 60%,刷新行业认知

   2月5日的消息称,尽管DeepSeek未公开其硬件配置的具体细节,但普遍认为其采用了大量NVIDIA的AI芯片,包括H100、H800和H20等多种型号。而最近的爆料显示,DeepSeek还对华为最新的AI芯片——昇腾910C进行了测试验证。

华为昇腾910C AI推理性能超越NVIDIA H100 60%:国产7nm工艺惊艳亮相,DeepSeek验证实效

   昇腾910C据报在2024年末开始向若干客户进行大规模供货,其中包括阿里巴巴、百度、腾讯等大企业,首批数量约为7万颗,每颗价格大约为2万元。

华为昇腾910C AI推理性能超越NVIDIA H100 60%:国产7nm工艺惊艳亮相,DeepSeek验证实效

   消息显示,昇腾910C采用了中芯国际的7nm工艺制造,chiplets双芯片整合封装,晶体管数量达530亿个,整体国产化率已达55%左右。

   它可以平替NVIDIA H100,同样用于大规模的AI训练和推理,FP8、FP16、FP32、FP64等不同数据类型下均有不俗表现。

   昇腾910C

   按照最新说法,DeepSeek团队的实测数据显示,华为昇腾910C在AI推理中的表现出乎意料地好,已经达到NVIDIA H100芯片的60%左右。

   更进一步地,通过手写CUNN内核和优化,昇腾910C的性能还可以进一步提升。

   据称,DeepSeek自成立之初便兼容了华为昇腾芯片,并且自主维护着PyTorch仓库。仅需一行代码即可实现CUDA到CUNN的转换,这不仅简化了开发流程,还为性能优化提供了广阔的空间。通过深度定制和优化,可以进一步挖掘其潜在的高性能表现。 这种技术上的突破无疑为开发者们带来了极大的便利,同时也展示了DeepSeek在技术创新方面的强大实力。能够自主维护PyTorch仓库意味着他们对底层技术有着深入的理解和掌控力,这对于推动整个AI领域的发展具有重要意义。此外,简化从CUDA到CUNN的转换过程,不仅降低了技术门槛,也为更多的开发者和研究者提供了便捷,有助于加速人工智能技术的应用与普及。

   然而需要注意的是,目前了解到的情况是昇腾910在AI推理性能方面表现优异,但其AI训练性能可能仍然不够理想。

   昇腾910

人工智能最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有