Reports & Publications

64 GPU AI 运算性能对比测试 H3C RoCE 网络 (S9825 系列交换机) vs. InfiniBand ⽹络

Sponsor: New H3C Technologies Co., Ltd
64 GPU AI 运算性能对比测试 H3C RoCE 网络 (S9825 系列交换机) vs. InfiniBand ⽹络

Abstract

H3C S9825 系列交换机 S9825-64D、S9825-128B 是 H3C 公司面向数据中心推出的新一代高性能、高密度 400GE/200GE/100GE 以太网交换机。S9825 采用单颗转发芯片设计,提供高密 400GE/200GE/100GE 端口,全部端口支持全线速转发;支持冗余可插拨电源和风扇。

Tolly 测试评估了基于 64 GPU 的集合通信库 NVIDIA Collective Communication Library (NCCL) 以及大模型(Llama3)在不同网络架构下的表现。具体来说,测试对比采用 H3C S9825 交换机的 RDMA over Converged Ethernet(RoCE)网络与采用 NVIDIA QM9700 交换机的 InfiniBand(IB)网络架构在 64 GPU 环境上的性能差异。测试中的 RoCE 网络和 IB 网络均采用如图 1 所示的多轨组网。

NCCL 和大语言模型 Llama3 的测试结果表明,相同的业务场景下,RoCE 带来与 IB 相仿的性能和一致的业务体验。