115: 华为发布超节点，如何搅动 AI 算力市场？与魔形智能徐凌杰聊芯片层新变化

晚点聊 LateTalk

2025/05/11

Overview Shownote Highlights Transcript Chapters Pins

本期播客围绕华为 CloudMatrix 384 超节点 AI 集群的发布展开讨论，深入分析了其与英伟达 NVL72 集群方案的异同，并探讨了超节点技术对 AI 算力市场的影响。嘉宾徐凌杰结合自身丰富的行业经验，从芯片设计、互联技术到系统优化等多个角度解析了当前 AI 算力市场的趋势与挑战。

华为 CloudMatrix 384 超节点 AI 集群的发布标志着 AI 算力市场的新变化，其总算力达到 300P，相较于英伟达 NVL72 有显著提升。超节点技术更偏向横向扩展（scale out），而 NVL72 则为纵向扩展（scale up）。AI 算力不仅依赖于 GPU，还需关注交换互联和散热问题。英伟达通过 NVLink 和 NVSwitch 技术提升了 GPU 间的通信效率，但国内厂商在高速接口 IP 设计上仍面临挑战。超节点性能评估涉及显存带宽、数据格式精度等指标，训练阶段追求稳定性和规模，推理阶段关注成本效益。随着模型参数增大，显存需求显著提升，芯片成本结构逐渐向显存倾斜。华为 CloudMatrix 384 功耗较高，但在中国电费成本相对较低的情况下，以总量换性能成为可行策略。尽管华为超节点短期内对英伟达影响有限，但对其他国产芯片厂商构成较大压力。英伟达凭借全球最优供应链和 CUDA 生态保持领先地位，但也面临客户集中化的威胁。未来，新硬件架构如存算一体和类脑计算可能成为改变算力格局的变量。