64 GPU AI 运算性能对比测试 H3C RoCE 网络 (S9827 系列交换机) vs. InfiniBand ⽹络
Sponsor: New H3C Technologies Co., Ltd
All Reports Sponsored by this Vendor
Document Number: 225106ZH
Publication Date: 1/22/2025
Page Count: 4
Abstract
H3C S9827 交换机 H3C S9827-128DH、H3C S9827-64EP、H3C S9827-64E 支持高密度 800GE/400GE/200GE 端口,具备强大的转发能力,最大支持 64 个 800GE 或 128 个 400G 端口并且兼容 LPO 光模块和 ZR 长距光模块。也可以支持拆分至 256 个 200GE 端口,具有极高的端口密度和强大的转发能力,可以满足超大数据中心和 AIGC 算力网络高密度服务器无收敛接入的组网需求。同时 400G QSFP112 端口支持兼容 200G QSFP56 和 100G QSFP28 光模块。
Tolly 测试评估了基于 64 GPU 的集合通信库 NVIDIA Collective Communication Library (NCCL) 以及大模型(Llama3)在不同网络架构下的表现。具体来说,测试对比采用 H3C S9827 交换机的 RDMA over Converged Ethernet(RoCE)网络与采用 NVIDIA QM9700 交换机的 InfiniBand(IB)网络架构在 64 GPU 环境上的性能差异。测试中的 RoCE 网络和 IB 网络均采用如图 1 所示的多轨组网。
NCCL 和大语言模型 Llama3 的测试结果表明,相同的业务场景下,RoCE 带来与 IB 相仿的性能和一致的业务体验。
Login Sign-up