>
正文
DeepSeek V4开源引爆A股算力,Cambricon月涨60%而NVIDIA承压
2026-04-24 14:25

DeepSeek V4的正式发布标志着全球人工智能竞争格局的关键转折点。该模型包含1T参数的MoE主模型及285B参数的Flash版本,随后全功能1.6T Pro版本迅速问世,并在GitHub上以Apache 2.0许可证完全开源,权重数据与部署代码同步公开。这一动作在发布后24小时内引发了资本市场的剧烈分化反应,资金流向清晰地揭示了市场对技术路线的新判断。午方 AI获悉,A股计算能力相关个股几乎全线上涨,其中Cambricon股票连续11个交易日上升,单日涨幅达3.7%,月累计涨幅超60%;华为科技触及10%涨停板,最终收盘涨8.4%;中芯国际A股涨4.91%,H股涨8.81%;海思半导体H股一度飙升至18%,收盘涨12%;CSI半导体芯片ETF单日吸金24亿元人民币,创下历史新高。

相比之下,香港股市中主打“自主研发大规模模型”的AI企业却遭遇资金出逃。WiseSpec股价下跌8.07%,空仓比率高达9.9%;MiniMax股价下跌7.40%,空仓比率激增至22.87%,创下过去三个月港股AI板块单日新高。这两家2025年下半年上市的企业,其招股书核心卖点与DeepSeek V4的开源策略形成鲜明对比。

与此同时,太平洋彼岸的NVIDIA股价下跌1.8%,盘中最大跌幅达2.6%,最终收盘持平。彭博社分析指出,这与1月27日V3发布引发的6000亿美元市值蒸发的恐慌性抛售不同,此次更像是一次方向明确的价格调整,反映出机构观点的转变:中国AI推理需求正开始与北美市场分道扬镳。

这种市场反应的深层逻辑在于过去30天内全球模型发布密度的剧增。从3月26日至4月24日,包括Anthropic Opus 4.6、Google Gemini 3.1 Pro、OpenAI GPT-5.5、Mistral Large 3、Meta Llama 4、Kimi K2.6、Qwen3-Next、Byte Bean 2.5 Pro、腾讯Huan Yuan 3.0等在内的11款重磅模型密集发布,平均每2.7天就有一款新模型问世。午方 AI了解到,尽管这些模型在LMArena排行榜上的分数差距普遍不超过50分,属于同一性能级别,但决定资本流向的关键在于开源协议与发布时机的结合。在前十模型中,仅有Llama 4开源,但其商业限制条款导致开发者社区评价平平,OpenRouter在发布三天后便跌出前十;而DeepSeek V4采用无限制的Apache 2.0协议,推理代码同步公开,在过去六个月里从性能、价格和开放性三个维度对闭源阵营构成巨大压力。

DeepSeek V4的发布公告中首次出现了一句具有里程碑意义的声明:“在发布当天,Cambricon SNN 590和华为Ascend 950PR即可实现全栈适配,部署代码与开源版本保持一致。”这一声明将过去12个月的三件平行事件串联起来,彻底改变了硬件与软件的博弈格局。首先是硬件层面,华为Ascend 950PR于2025年12月量产,FP4算力达1.56 PFLOPS,HBM容量112GB,首次在硬件指标上直接挑战NVIDIA B系列芯片。在1T参数V4 MoE推理任务中,Ascend 950PR单卡处理能力是H20的2.87倍;配合CANN 8.0软件栈优化,在由8块Ascend 950PR组成的SuperNode上运行V4,端到端推理延迟比H100集群低35%。Cambricon SNN 590单芯片FP8算力与H100相当,售价却不足一半。

其次是软件生态的突破。4月22日,vLLM主线代码合并了Cambricon MLU后端,使开源推理框架首次原生支持非NVIDIA国产GPU;DeepCloud开发的DCU虽通过ROCm生态支持V4,但也顺利运行了MoE路由层。

这意味着V4部署不再受限于单一国产GPU,打破了生态依赖,标志着生产领域的关键转折。午方 AI监测到,这一技术突破直接回应了硅谷的担忧。4月15日在台积电分析师日上,NVIDIA CEO黄仁勋直言:“如果他们能让大语言模型摆脱对CUDA的依赖,那将是巨大威胁。”九天后,DeepSeek V4的发布用行动给出了答案,将“国产替代”从模糊概念转化为可量化的单卡算力、推理延迟和部署成本数据。

资本市场的重新定价逻辑已十分清晰:Cambricon的连续上涨不再仅因“国产GPU概念”,而是因其成为DeepSeek V4推理基础设施的核心提供商;中芯国际H股上涨12%,则是因为其利用7纳米工艺制造Ascend 950PR,每一枚在国产芯片上运行的V4模型,都意味着原本属于NVIDIA和台积电的产能留在了珠江三角洲。未来路径也已明确,华为计划于2026年第四季度推出950DT训练版芯片,目标是在万卡集群上实现V5或同级模型的全栈训练。若该计划成功,CUDA在中国大模型训练领域的垄断地位将从“不可或缺”转变为“可选而已”,全球AI产业链的价值分配将迎来历史性重构。

免责声明:本内容为作者独立观点,不代表平台立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。
标签:
DeepSeek V4
SWE-Bench
DeepCloud DCU
CUDA
ROCm
Huawei Ascend 950DT
vLLM
Huawei Ascend 950PR
Cambricon SNN 590
CANN 8.0
A-share
Hong Kong stock market
TSMC
OpenRouter
Bloomberg
Jensen Huang
分享:
back