返回列表 发布新帖
查看: 4|回复: 0

3年增长15倍,超节点:打破英伟达垄断!

[复制链接] [复制链接]

1817

主题

13

回帖

5708

积分

超级版主

积分
5708
发表于 2 小时前 | 查看全部 |阅读模式
周末最重磅的事件就是:4月24日的《DeepSeekV4昇腾首发!》

但是90%的人没有搞清楚影响以下2个问题:

第一、对整体市场影响在多大?

第二、机会在哪里?

而通过研究,4月24日对全球AI圈迎来了一场预谋已久的“技术海啸”。

DeepSeek V4正式面世,这不仅是算法维度的范式跃迁,更是国产算力生态(昇腾)与顶级大模型深度耦合的终极闭环。

这场变革甚至惊动了硅谷的核心。英伟达CEO黄仁勋:在近期访谈中发出了震动华尔街的战略预警:“DeepSeek与华为昇腾芯片的深度适配,对美国来说将是一个灾难性的结果(A bad result)。”



而我更发现了有一个:3年10倍新增量的爆发性:超节点!

一、为什么 DeepSeek + 昇腾会引爆:超节点?



1、 芯模深度协同,解决 “卡脖子” 的核心矛盾

模型适配从 “被动兼容” 到 “主动定义”:DeepSeek-V4 在设计阶段就与昇腾联合定义超节点架构,重写核心代码适配 CANN 生态,而非事后移植。

算法 + 硬件双向优化:昇腾 950 的FP8/MXFP4 原生支持、稀疏访存优化、共享内存架构,完美匹配 DeepSeek 的细粒度专家并行(EP),推理性能较初期适配提升数十倍。

性能反超:在昇腾超节点上,DeepSeek-V4 的推理性能远超英伟达 H20,部分场景加速比达1.96 倍。



2、 供需共振,打开规模化落地的 “闸门”

模型端:DeepSeek-V4-Pro 因算力稀缺,当前服务价格高企;明确表示下半年昇腾 950 超节点批量上市后,价格将大幅下调。

硬件端:华为昇腾超节点(Atlas 950/960)已实现8192 卡 / 15488 卡的超大规模部署,可级联成百万卡级集群,是全球算力最强的集群方案。

生态端:昇腾 CANN 全面开源,兼容主流框架,形成芯片 + CANN + 框架的完整原生生态,吸引全行业迁移。

3、 国产替代的 “临界点” 已至

在高端 GPU 被禁运的背景下,DeepSeek + 昇腾首次证明:全球顶级大模型可以完全跑在国产算力上,且性能不弱于英伟达。这是从 “能用” 到 “好用” 的质变,直接引爆超节点的规模化采购与部署。



二、为什么是现在爆发(2026年Q3拐点),而不是2025年?

这是本轮超节点行情最核心、最本质的拐点差异,直接解释:去年是概念,今年是产业革命。



1、2025年:超节点只有“架构”,没有“国产硬件支撑”

2025年市场不炒超节点的核心原因:

国产AI芯片不支持Scale-Up超节点:寒武纪、海光、昇腾老款芯片,无法做32卡以上紧耦合统一内存组网,只能做传统松散集群。

无大模型原生适配:国产模型都是适配英伟达CUDA架构,国产超节点跑模型效率极低、无商用价值。

无配套网络芯片:国产25.6T不成熟、51.2T空白,博通垄断,超节点组网成本极高、交期极差。

结论:2025年超节点 =纯概念,无法落地、无订单、无业绩。

2、2026年:三重拐点同时落地(产业质变)



拐点1:国产AI芯片集体支持超节点(硬件底座成型)

2026年新量产芯片全部原生支持Scale-Up超节点:

昇腾950PR+寒武纪690+海光深算4号=超节点

国产芯片首次具备:统一内存、TB级互联、纳秒级时延、32-128卡紧耦合组网能力。

拐点2:DeepSeek+昇腾芯模一体验证成功(商业价值落地)

国内首次实现:全球顶级MoE大模型,原生适配国产超节点,性能超越英伟达H20。

彻底打破行业认知:“只有英伟达能跑超大模型”。

超节点从“能用”变成“好用、性价比碾压、可商用”。



拐点3:海外博通供应链危机(国产替代窗口期)

博通51.2T交换芯片交期52周+、缺货、丢包问题频发

大厂算力建设无法等待,国产51.2T成为唯一解

最终结论:2026Q3是国产超节点量产元年

Q2芯片回片、验证;Q3大规模整机交付、互联网大厂集中采购、业绩正式兑现。

三、什么是超节点?解决了什么行业终极痛点?



超节点(SuperPod)是面向万亿级参数大模型训练与推理的新一代算力集群架构,由英伟达率先提出,核心是通过超高速、低时延的专用互联总线,将数十至数千颗 AI 芯片(GPU/NPU)在逻辑上整合成一台 “超级计算机”。

1、核心特征(中国信通院定义)

高密度集成:单节点支持32 卡及以上,单机柜可集成数百卡。

极致互联:芯片间带宽≥400GB/s,交换时延 < 500ns,替代传统以太网。

统一内存:域内芯片内存统一编址,可直接互访,消除数据搬运瓶颈。

对等计算:打破以 CPU 为中心的冯・诺依曼架构,实现无中心、全对等协同。

通俗理解:传统算力是 “多台电脑通过网线连在一起”,超节点是 “把数千颗芯片焊在同一块超高速背板上,逻辑上就是一台电脑”,专门解决MoE 大模型的TB 级通信量与万卡级协同难题。

2、AI产业终极矛盾



大模型参数爆发(万亿MoE)→通信量爆炸式增长 →传统以太网松散集群彻底扛不住

传统集群算力利用率:20%-30%

超节点紧耦合集群算力利用率:45%-70%



3、国产算力的“换道超车唯一路径”

国产单卡制程、单卡算力对比英伟达仍有差距。

但超节点=系统级架构碾压:

不靠单卡硬拼,靠Scale-Up紧耦合组网+极致互联,实现集群整体算力反超。

这是国产算力唯一能追上、甚至超越英伟达的技术路线。

4、产业范式彻底切换

过去AI行情:炒单卡GPU/NPU性能

未来AI行情:炒算力集群架构、炒互联、炒系统集成、炒交换网络

价值权重彻底转移:芯片占比下降,网络/系统/液冷价值大幅提升

四、超节点市场规模与价值细分:

1、超节点市场规模

按主流机构(华泰、东吴、IDC)测算,2028 年国内超节点总市场约 3414 亿元,2026–2028 年 CAGR 达194%。



2、超节点产品价值结构

超节点价值从 “单卡为王” 转向系统级分配,Scale-Up 互联(交换芯片 + 交换机)成为最大增量。

第一、核心环节价值占比(2028 年)



第二、价值跃迁对比(传统 vs 超节点)

传统 AI 服务器:交换芯片占比5%–8%

超节点:交换芯片 + 交换机占比20%–30%,价值量提升 3–5 倍。

五、超节点爆发,谁才是最大增量点?



1、核心技术壁垒(三大核心)

Scale-Up紧耦合组网:统一内存、多卡无阻塞互联、纳秒级时延(超节点核心灵魂)

51.2T高端交换:25.6T组网吃力,51.2T是超节点规模化唯一刚需

高密度整机柜液冷:单机柜50kW+高功率散热刚需

2、行业最大卡点(当前真正的瓶颈)



当前国产超节点不缺AI芯片、不缺整机、不缺模型

唯一卡点:51.2T高端交换芯片国产量产

博通缺货、交期一年以上,海外供给彻底卡死国内超节点扩产速度。

谁搞定51.2T量产,谁就是本轮超节点行情的绝对龙头?

3、为什么以太网+第三方芯片是未来主线?



第一、私有协议(华为灵衢)的问题

绑定自家昇腾,生态封闭,无法适配寒武纪、海光等多厂商芯片,互联网大厂拒绝单一绑定,需要中立通用方案。

第二、以太网路径成为国产超节点统一标准

兼容全厂商国产卡、成本更低、生态全球化、可规模化复制。

互联网大厂(字节/阿里/腾讯)全部选定以太网Scale-Up路线。

第三、第三方中立交换芯片价值爆炸

不绑定任何AI芯片厂商,适配全行业,是全国产超节点的公共基建。

六、相关受益公司:



总结:本轮超节点行情本质是国产AI算力体系从“可用”到“好用”的价值重估。事件驱动已至临界点,产业逻辑清晰无匹,内部价值结构正发生根本性转移。

超节点的战略意义:对国产算力:从跟跑到并跑的转折点,彻底摆脱英伟达依赖。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

admin@discuz.vip

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 添加微信客服
  • 关注公众号
MACD888量化www.macd888.com -MACD量化论坛-MACD股票论坛-MACD888股票论坛-macd论坛-macd网站-macd官网-Macd888论坛官方-macd俱乐部 © 2001-2026 Discuz! Team. Powered by Discuz! W1.5 闽ICP备2025120954号-1
关灯 在本版发帖
扫一扫添加微信客服
返回顶部
快速回复 返回顶部 返回列表