华为首次展出“算力核弹”真机,获评镇馆之宝
(文/观察者网 吕栋)
图源:观察者网
相比英伟达NVL72等行业超节点方案,昇腾超节点最关键的创新,在于彻底打破了传统以CPU为中心的冯诺依曼架构,既“主从架构”,创新提出了“全对等架构”,凭借高速互联总线的关键突破,把总线从服务器内部扩展到整机柜、甚至跨机柜,最终将CPU、NPU、DPU、存储和内存等资源全部互联和池化,这样就能去除掉繁多的中转环节,从而实现真正的点对点互联,进而实现更大的算力密度和互联带宽。
纵观国内,目前使用全国产芯片构建超节点,还能全面超越英伟达NVL72的,只有华为。昇腾384超节点通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,它的算力总规模达300Pflops,是英伟达NVL72的1.7倍;网络互联总带宽达269TB/s,比英伟达NVL72提升107%;内存总带宽达1229TB/s,比英伟达NVL72提升113%;单卡推理吞吐量跃升到2300 Tokens/s。
更重要的是,通过最佳负载均衡组网等方案,昇腾超节点还能进一步扩展为包含数万卡的Atlas 900 SuperCluster超节点集群,未来可以支撑更大规模的模型演进。
观察者网获得的性能测试数据显示,在昇腾超节点集群上,LLaMA3等千亿稠密模型性能相比传统集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模态、MoE模型上,性能提升可达3倍以上,较业界其他集群高出1.2倍,在行业中处于领先地位。
昇腾384超节点架构
观察者网了解到,本次参展WAIC,华为展台面积超过800平方米,除了展示昇腾软硬件能力,训练、推理解决方案和开源开放的软硬件生态,还携手伙伴共同展示互联网、运营商、金融、政务、医疗、油气、交通等11大行业解决方案实践,供与会者现场参观交流。
1、外交部副部长孙卫东同东盟秘书长高金洪就中国东盟合作交换意见
2、罗马诺:尤文与巴黎下周将就穆阿尼的转会进行新一轮谈判,意甲尤文vs罗马