单机多卡内存和GPU、GPU和GPU之间互联可通过PCIE、NVLink、NVSwitch;
多机多卡GPU之间(不同主机)、CPU与GPU之间互联可通过GPUDirect RDMA、IB/万兆以太网 + TCP/IP;
单机多卡
NCCL;Gloo;
多机多卡
NCCL2.x;MPI;TCP/IP;Gloo;
- 模型并行和数据并行
- PS架构和Ring架构
- 底层通信方案对比(NCCL,Gloo,MPI……)
-------------------------------------------------