这两天,曙光scaleX640超节点以单机柜算力密度20倍提升,引起算力市场广泛关注。业内以昇腾384为参照,从不同角度对比了两大超节点异同。总体来看,scaleX640除了在总体性能指标上取得阶段性领*,双方在架构理念上各有侧重,均为国产计算集群发展提供了良好的落地参考。
先来看根本路线上的差异:昇腾384主要围绕华为全栈技术闭环,构建出业界大规模高速总线互联超节点,打破了AI算力互联瓶颈;曙光scaleX640则是基于AI计算开放架构,拉通产业跨层协作,定位于开放普惠的计算集群。
明显的区别就是,前者仅支持昇腾加速卡,并围绕CANN展开生态建设,封闭性较强;后者支持不同类型的国产加速卡,并兼容主流AI计算生态,开发性特征明显。两者完全可以类比“苹果模式”与“安卓模式”的差异。
再从主要性能指标来看,总算力输出上,昇腾384单机柜32卡算力约达25PF,该方案配备12个机柜,总算力可达300PF;scaleX640则将单机柜配置做到了640卡,采用“一拖二”高密架构组成1280卡计算单元,总算力规模达到了630 PFlops,是前者的2.1倍。
网络性能方面,384超节点HBM总带宽达1229 TB/s,片间互连总带宽 573 TB/s,是此前突破Decode时延15ms的方案;曙光scaleX640则采用层次化高速互连网络,HBM总带宽突破至2304 TB/s,片间互连总带宽 573 TB/s,两项指标均为前者的1.9倍。
此外,在能源使用效率上,昇腾384超节点的PUE值基本徘徊在1.1-1.15区间,已经处于相对领*水平;曙光scaleX640则更进一步通过液冷技术,将PUE降至1.04,据说这一数据已经赶超NVL576预计的2027年能效水平。
现阶段来看,scaleX640综合性能指标领*优势较为明显。并且,业内人士认为,相比单一企业主导的封闭生态,开放的生态系统更加复杂,跨厂商技术对齐和产业协作难度大,而且国产算力产业还面临行业统一标准欠缺、自主软硬件生态不成熟等问题。
曙光scaleX640能在此背景下取得明显突破,对于开放式计算路线是一次极大的信心提振。目前英伟达GPU已逐渐淡出中国市场,期待两大超节点路线继续保持赶超脚步,加速驱动国产计算集群协同向上。
来源:互联网的一些事公众号




