首页 > IT新闻 > IT新闻
发布日期:2025-07-27 11:11:47

华为昇腾384超节点首现线下,任正非预言成真:芯片难题或已破解

昇腾384超节点亮相,任正非芯片梦迎来关键突破

   7月27日消息,今年6月,华为CEO任正非在接受人民日报采访时表示,芯片问题无需过度担忧,通过采用叠加和集群等技术手段,计算效果可以达到与最先进水平相当的水准。

华为昇腾384超节点首现线下,任正非预言成真:芯片难题或已破解

   我们单芯片技术仍落后美国一代,但通过数学方法弥补物理限制、以非摩尔定律路径替代传统摩尔定律发展,同时借助群计算来弥补单芯片的不足,在实际应用中也能达到可用水平。他说。 在我看来,这种技术路径的选择体现了中国在面对芯片技术短板时的务实态度和创新思维。在无法短期内突破单芯片性能瓶颈的情况下,通过算法优化、计算架构重构等手段实现系统层面的性能提升,是一种具有战略意义的应对方式。这种方式不仅有助于缩短与发达国家的技术差距,也为未来自主可控的计算体系打下基础。

华为昇腾384超节点首现线下,任正非预言成真:芯片难题或已破解

   如今,这句话已经应验。

华为昇腾384超节点首现线下,任正非预言成真:芯片难题或已破解

   7月26日,2025年世界人工智能大会(WAIC)在上海世博中心正式开幕,华为首次以线下形式展出其昇腾384超节点,即Atlas900A3SuperPoD。该产品采用超节点架构,通过总线技术实现384个NPU之间的高带宽、低时延互联,有效解决了集群内部计算与存储等资源之间的通信瓶颈问题。

华为昇腾384超节点首现线下,任正非预言成真:芯片难题或已破解

   通过系统工程的优化,实现资源的高效调度,让超节点像一台计算机一样工作。

华为昇腾384超节点首现线下,任正非预言成真:芯片难题或已破解

   在今年5月的鲲鹏昇腾开发者大会上,华为发布了昇腾超节点(CloudMatrix384),实现了业界最大规模的384卡高速总线互联。昇腾超节点凭借超大带宽、超低时延和超强性能三大特点,提供了多款适用于训练与推理的产品。该超节点采用创新架构,更有效地满足模型训练与推理在低时延、大带宽及长期稳定可靠方面的需求。

华为昇腾384超节点首现线下,任正非预言成真:芯片难题或已破解

   本月初,华为云官微发布了一段视频,展示了CloudMatrix384超节点算力集群的强大性能——这一技术成果体现了企业在云计算领域的持续突破与创新能力。该算力集群在处理大规模数据和复杂计算任务时展现出卓越的效率与稳定性,为人工智能、大数据分析等前沿领域提供了坚实的技术支撑。随着数字化转型的不断深入,高性能算力已成为推动行业发展的重要引擎,华为云在这一领域的布局和实践,无疑为行业树立了新的标杆。

   384颗昇腾NPU(昇腾910C)与192颗鲲鹏CPU实现全对等互联,构建出一台“超级AI服务器”;这种配置展现了在人工智能算力架构上的深度整合与创新,体现了国产芯片在高性能计算领域的持续突破。通过将不同类型的处理器进行高效协同,不仅提升了整体算力水平,也为大规模AI模型训练和推理提供了更强大的支撑。这种技术组合方式,或将为未来智能计算平台的发展提供新的方向。

   业界最大单卡推理吞吐量——2300Tokens/s;

   业界最大集群算力——16万卡,万卡线性度高达95%;

   云上确定性运维-40天长稳训练、10分钟快速恢复。

   华为云表示,新一代昇腾AI云服务,是专为大模型应用打造的高效算力平台。

   简单来说,华为CloudMatrix并非简单地“堆卡”,而是基于高带宽全对等互联(Peer-to-Peer)架构进行设计,这一技术理念体现了CloudMatrix384硬件架构的重要创新。这种设计不仅提升了系统内部的数据传输效率,也为更高性能的计算提供了坚实的基础。在当前算力需求不断增长的背景下,这种架构的突破具有重要意义,预示着未来数据中心和高性能计算领域可能迎来新的发展方向。

   在传统的AI集群架构中,CPU扮演着类似公司领导的角色,而NPU等其他硬件则更像下属员工。在数据传输过程中,必须经过CPU的审批和确认,这大大降低了整体效率。

   但在CloudMatrix384中,CPU和NPU等硬件更像是一个扁平化管理的团队,它们之间的地位比较平等,直接通过UB网络通信直接对话,效率自然就上来了。

   今年4月份,国际知名半导体研究和咨询机构SemiAnalysis发布专题报道称,华为云最新推出的AI算力集群解决方案CloudMatrix384(简称CM384)在系统架构设计与全栈技术创新方面展现出显著优势,在多项关键性能指标上超越了英伟达旗舰产品GB200NVL72,标志着中国在人工智能基础设施领域取得了重要的技术突破。 从行业发展趋势来看,算力已成为推动人工智能发展的核心要素。此次华为云CM384的发布,不仅体现了国内企业在高端芯片与系统集成方面的自主研发能力,也反映出中国在全球AI基础设施竞争中正逐步占据更有利的位置。这一突破对于提升我国在高科技领域的自主可控能力具有重要意义。

   据SemiAnalysis披露,华为云CM384基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。此外,CM384在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模AI训练和推理提供了更高效的硬件支持。

   (图片引自SemiAnalysis报道)

   报道分析称,尽管单颗昇腾芯片的性能约为英伟达Blackwell架构GPU的三分之一,但华为通过大规模系统设计,成功提升了整体算力,在超大规模模型训练和实时推理等场景中展现出更强的竞争力。

   SemiAnalysis还提到,华为的工程优势不仅体现在芯片技术上,更在于系统层面的创新,涵盖网络架构、光互连技术以及软件优化,使得CM384能够充分释放集群计算能力,满足超大规模人工智能计算的需求。

   此次华为云CloudMatrix384的推出,标志着中国在AI计算系统领域已具备与国际领先企业直接竞争的能力。

   SemiAnalysis在报道中特别提到,华为的规模化解决方案在技术上比英伟达和AMD目前市场上的产品领先一代,并认为中国在AI基础设施领域的突破将对全球AI产业格局产生深远影响。

IT新闻最新资讯
友情链接 百度权重≥3友情链接交换
数界探索  |  科技快讯中文网  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
Copyright © 2025 智慧科技官网 网暻网络
备案号:陇ICP备16003923号-4 版权所有