浦江AI学术年会DeepLink正式发布《超节点技术体系白皮书》

志斌 • 2026年4月2日下午3:19 • 人工智能

在 AI 大模型持续演进与科学计算需求快速增长的背景下，算力产业正从单点芯片性能竞争，转向围绕系统能力边界展开的新一轮跃迁。近日，在第二届浦江AI学术年会上，由上海人工智能实验室DeepLink团队牵头的《超节点技术体系白皮书》（以下简称“白皮书”）正式发布。DeepLink团队联合8所顶尖高校、16家核心产业伙伴达成了阶段性产业共识，覆盖芯片研发、芯片产业链、算力部署、软件适配、学术研究、行业应用等全产业链环节，是目前市面上参与最广泛、内容最全面的产业共识性成果，真正实现了“全行业发声、全维度共建”。

白皮书链接：https://deeplink-org.github.io/superpod-whitepaper/

随着大模型预训练、后训练、测试扩展及Agent应用等新范式持续推高算力需求，算力短缺与算力利用率低下的双重痛点日益凸显。数据显示，过去5年预训练所需算力增长约3000倍，而同期单芯片算力仅增长约16倍，单纯依靠单芯片性能提升已难以突破产业发展瓶颈，算力竞争的焦点已从“芯片参数”转向“系统能力的有效组织与稳定兑现”。在此背景下，超节点作为追求算力增长的极致系统工程路径，其核心价值不在于硬件的简单堆叠，而在于通过高带宽、低时延、低抖动的受控系统域，整合通信、远端访存、协同调度等关键能力，将理论算力潜力转化为真实场景中可交付的有效产出（Goodput），这也是白皮书重点破解的核心命题。

在内容组织上，白皮书从架构分析、软件系统、建模仿真、参考设计和未来演进五大维度全面展开，形成了完整的技术体系梳理：既深入梳理超节点形成的技术背景与演进逻辑，解读当前Scale-up架构成为算力突破关键的行业趋势；也详细探讨统一内存访问、通信库、编程模型、RAS可靠性体系和训练推理工程等软件兑现路径，回应行业对“软硬协同”的核心需求；既通过建模仿真将系统边界、真实交付与未来演进纳入统一坐标系，也结合产业现状推出五类超节点参考构型，涵盖总线全对等互联、以太全对等互联等标准构型，以及Dragonfly、3D Torus和大环路加分布式OCS等前沿构型，适配不同产业阶段、不同负载特征和不同供应链条件下的设计取舍，为产业落地提供直接参考。相较于当前行业内部分聚焦单一互联技术、单一硬件方案的相关成果，本白皮书全面覆盖超节点从理论到实践、从硬件到软件、从现状到未来的全维度内容，为不同领域的参与者提供了清晰的行动指引。

白皮书推动形成“技术共识—实践验证—迭代优化”的良性循环，为超节点技术发展提供了可讨论、可验证、可持续演进的系统工程框架，推动算力产业从“单点突破”走向“系统跃迁”，为AI与科学计算发展夯实基础。发布现场强调，白皮书的发布只是起点，而非终点。上海AI实验室特向全行业发出诚挚邀约，欢迎更多高校、科研机构、产业伙伴、技术从业者加入白皮书的内容建设中来，共同丰富内容体系、验证技术方案、完善参考设计、推动标准落地，让白皮书持续迭代升级，真正成为引领超节点技术发展、支撑产业高质量发展的核心指南。