通过交互式动画,直观理解高性能计算中的核心技术原理
理解大模型训练中多GPU如何协作:前向传播、反向传播、梯度同步的完整流程
理解大模型推理中多GPU如何协作:Prefill、Decode、KV Cache 的工作原理