和硕重磅出击:AMD MI350X超级机架问世,1177 PFLOP性能直指英伟达王座
5月24日消息,据Tom'sHardware报道,和硕在台北国际电脑展上展出了一款创新的AI机架解决方案。
据介绍,该系统搭载了128颗AMD最新推出的Instinct MI350X GPU,这款GPU专为高效率的AI推理与训练任务量身打造,其性能表现相较于AMD官方发布的机架式解决方案更为先进,处于更领先的架构水平。这一技术突破不仅展示了AMD在加速计算领域的持续创新力,也标志着AI硬件发展迈入了一个新的阶段。对于行业而言,这意味着更加高效的计算能力,能够显著提升AI模型的训练速度和推理效果,从而推动更多前沿科技的落地应用。同时,这也提醒我们,随着技术竞争日益激烈,企业需要紧跟硬件升级的步伐,以保持自身在AI领域的竞争力。
该平台将作为和硕开发下一代AMD Instinct MI300系列处理器IF64/IF128系统的验证工具,相关产品计划在一年后投入量产。这一进展不仅展示了和硕在高性能计算领域的技术实力,也预示着未来数据中心市场可能迎来新的突破。随着人工智能和大数据需求的不断增长,这类高性能芯片的应用前景十分广阔,值得持续关注其后续发展动态。
和硕 AS501-4A1 / AS500-4A1 系统采用了 8 组 5U 计算单元,每组包含 1 颗 AMD EPYC 9005 处理器和 4 颗 Instinct MI350X 加速器,采用液冷散热方案以保障高负载下的稳定性能。整机采用 51OU ORV3 规格设计,适配遵循 OCP 开放计算标准的云数据中心(例如 Meta)。
尽管AMD的Infinity Fabric技术已经相当成熟,但截至目前仍未推出专门的交换设备,这意味着其最大集群规模仍受限于8颗GPU,且这些GPU之间仅能通过400GbE网络进行互联。相比之下,英伟达的GB200/GB300 NVL72平台凭借NVLink技术,能够实现多达72颗GPU的直接互联。这种架构上的差异使得MI350X系统的扩展能力暂时难以与英伟达的解决方案相匹敌。 从当前的技术布局来看,AMD在高性能计算领域依然面临一定的挑战。虽然其产品在单节点性能上具备竞争力,但在大规模集群的扩展性和互连效率方面,还需要进一步的技术突破。而英伟达则凭借NVLink等创新技术,在超大规模计算场景中占据了明显的优势。未来,AMD若想在这一领域迎头赶上,或许需要加快开发专用的Infinity Fabric交换设备,以提升其整体系统的可扩展性与市场竞争力。同时,这也提醒我们,技术创新往往是一个持续迭代的过程,如何平衡短期市场需求与长期技术储备,将是所有科技公司都需要深思的问题。
该系统的独特优势在于能够为OCP用户打造开箱即用的AI算力平台,同时助力开发者深入学习多GPU系统构建的相关技术和方法;并且为打破英伟达在机架级AI解决方案领域的垄断地位提供坚实的技术支撑。
据AMD官方参数显示,和硕推出的128-GPU系统其理论峰值性能能够达到1,177PFLOPS(FP4精度)。每块MI350X芯片配备了288GB HBM3E显存,整个系统总计拥有36.8TB显存容量,这一配置足以支持远超英伟达Blackwell架构GPU容量限制的超大规模AI模型运行。
该系统的显著局限性在于其对以太网进行GPU间通信的设计。由于单集群最多只能容纳8颗GPU,这种架构更适用于AI推理或分布式训练任务,而在需要高度同步的大规模语言模型训练方面则稍显不足,而这也是英伟达NVL72系统擅长的领域。即便如此,这一成果依然是高性能、大内存AI解决方案的重要进展,并为AMD未来推出的Instinct MI400系列产品的研发奠定了基础。
COMPUTEX 2025 台北电脑展专题