
随着4月即将进入尾声,当大多数AI从业者正准备迎接“五一”长假时,深度求索(DeepSeek)的官方社交媒体上,极其低调地推送了一条消息:DeepSeek-V4预览版正式发布并开源。

没有耗资千万的线下发布会,没有精心剪辑的演讲,甚至连官网的Banner位也只是低调地更换了几个字符。然而,随之而来的DeepSeek-V4版本的一系列优惠更新,却在短短的时间内让整个AI大厂的老板们陷入了集体“焦虑”:先是宣布DeepSeek-V4-Pro开启限时2.5折优惠,26日晚间再次宣布全系API缓存命中价格降至1/10,这意味着缓存命中的百万Tokens输入价格直接被杀到了0.025元。同时,DeepSeek还表示预告了下半年昇腾950超节点批量上市后,Pro的价格还会大幅下调。
DeepSeek的这一举动,无异于在平静的湖面投下了一颗万吨级的“深水炸弹”。当行业开始进入成熟期,各家模型厂商都由于急于寻求商业路径来回收开发成本、从而不可避免地走向价格上行区间时,DeepSeek的突然发布和开源,实际上是在用一种“成本的降维打击”强行掠夺市场。
这种逆向而行的策略,不仅成功将“大模型价格屠夫”的形象深刻地写入了行业心智,对于那些追求AI使用效率、对成本极度敏感的企业主而言,更是一场很难拒绝的“降本诱惑”,也为DeepSeek在激烈的B端竞争中收获更多订单创造了先发条件。
从“技术奇点”到“结构性冲击”
真正让行业意识到“大模型成本曲线可以被改写”,并不是某一个瞬间,而是从DeepSeek V3到DeepSeek R1再到DeepSeek V4连续推进的一段过程。
2024年底发布的V3,第一次让“低成本训练”成为可被验证的现实。通过MoE(Mixture of Experts,混合专家)架构、多标记预测(MTP)以及系统级优化,DeepSeek将训练成本压缩至数百万美元量级。在当时,这一数字已经明显偏离硅谷主流模型“亿级美元”的成本结构,但行业更多将其视为一种工程优化能力,而非范式变化。

2025年初的DeepSeek-R1的发布,更是成为了大模型行业的“核打击”。R1并不仅仅是在性能上对标OpenAI的o1系列,更关键的是,它通过强化学习(RL)路径,将“推理能力”这一原本高度稀缺且昂贵的资源进行了大规模释放。当接近顶级性能、可控以及显著成本下降三者同时成立时,行业开始第一次出现结构性动摇。
一部分依赖闭源API的企业开始重新计算成本模型。当价格下降到原有体系的十分之一甚至更低时,“性能溢价”本身的合理性开始被质疑。
更为重要的是,DeepSeek-V3与R1两款大模型的发布,不仅让DeepSeek收获了AI界的”拼多多”的称号,而与OpenAI等巨头的闭源路径不同,DeepSeek选择开源,其R1的发布被视作对全球AI行业的“核打击“,直接动摇了“烧钱堆算力“的行业底层逻辑。2025年1月27日,DeepSeek应用同时登顶苹果中美两国应用商店免费下载榜,在美国区更是超越了长期霸榜的ChatGPT,成为首个实现这一成就的中国应用。
进入V4阶段,DeepSeek对于成本的极致追求,正进一步向底层渗透。DeepSeek提出的DSA架构,在实现百万级上下文的同时,显著降低了推理阶段的显存需求。这意味着,性能提升不再线性依赖硬件堆叠。
在算力适配层面,DeepSeek在官方技术报告中,将华为昇腾950PR与英伟达H200纳入同等优先级支持体系。这一动作本身释放出一个信号:模型能力开始主动适配多元算力,而不是绑定单一生态。
如果说V3降低了训练门槛,R1重写了推理逻辑,那么V4则是动摇了算力供给的底层结构。它不再依赖单一的、昂贵的CUDA生态,而是通过国产算力的异构适配,将推理成本拉到了一个让友商绝望的“地板价”。
DeepSeek“破价”底气从何而来?
当DeepSeek-V4-Pro将缓存命中价格定在0.025元/百万Tokens时,它实际上是在用一种“极限施压”的方式,检验其他厂商的毛利率底线。
DeepSeek之所以具备这样的定价空间,首先来自于算力侧的成本优势。根据2026年4月的公开信息,V4已经完成对华为昇腾950PR芯片的Day 0适配。在量产条件下,该芯片的采购成本约为英伟达H200的三分之一,而在低精度推理场景中,其架构设计能够提供更高的能效比。这使得DeepSeek在单位算力成本上,与仍依赖高溢价GPU的厂商之间形成了显著的差距。

但仅有低成本算力,并不足以支撑如此激进的定价。而在大模型之家看来,第二个变量在于DeepSeek不仅是在通过“低价”洗牌,更是在通过“效率”招徕客户。
对于那些需要大规模调用AI能力的企业而言,DeepSeek-V4-Pro在Agentic Coding等复杂任务中展现出的实际交付质量,而在OpenClaw发布的4.24版本中,已正式将DeepSeek-V4-Flash设为系统默认推理模型,更是证明其具备了替代高价闭源模型的生产力价值。
当“价格屠夫”的标签与“顶级性能”划上等号时,市场的选择偏好便会发生不可逆的偏移。
DeepSeek正在用极低单价作为诱饵,换取庞大的调用数据与生态绑定,从而在规模效应中寻找新的商业平衡。
开源战略的“得”与“失”:生态红利与资本压力的对冲
DeepSeek的另一条主线,是始终坚持的开源策略。这一策略在2026年,开始呈现出更加复杂的两面性。
一方面,持续开源让DeepSeek迅速获得了生态层面的优势。对于大量初创公司和传统企业而言,自主部署模型成为现实选择,闭源API的吸引力正在下降。同时,围绕DeepSeek展开的社区优化,使其在事实层面获得了一支全球化的开发者网络,这种“外部研发能力”极难被复制。
然而,这种激进的策略并非没有代价。DeepSeek坚持的开源战略在赢得了全球开发者赞誉和市场占有率的同时,也面临着商业价值流失的阵痛。当模型权重被毫无保留地公开,DeepSeek失去了像OpenAI那样通过高额订阅费或企业定制费来覆盖巨额研发支出的直接路径。它在短时间内掠夺了原本属于闭源大厂的市场份额,却也将自己置于了一个必须不断证明“如何盈利”的聚光灯下。
这种商业化挑战在2026年变得尤为突出。虽然极致的效率让DeepSeek的单次调用成本极低,但随着模型参数迈向万亿量级,研发与维护一个能够支撑全球流量的API集群依然需要天文数字般的资金投入。开源让DeepSeek成为了事实上的行业基建,但这种基建的维护成本与它目前极低的收费标准之间,存在着一种需要资本来填补的巨大鸿沟。
正因如此,DeepSeek在近期做出了一个让外界震惊的决定,那就是打破多年来坚持的“永不融资”的铁律。有消息称DeepSeek近日启动了首轮大规模融资,目标估值在200亿至300亿美元之间,阿里巴巴与腾讯这两家曾经在底层架构上与DeepSeek竞争的对手,正为了入局而竞相出价。
长期以来,背靠量化巨头幻方量化的DeepSeek被视为AI界的另类,它不依赖外部融资,全凭自有资金驱动,甚至被赋予了一种技术乌托邦的色彩。但在2026年这个万卡集群已成标配、研发投入指数级攀升的节点,即便强大的幻方也感受到了资金密度的压力。
启动大规模融资意味着DeepSeek正在从一家理想主义的技术实验室向现实主义的产业巨头转型。据传其首轮融资的参与者中不乏昔日的竞争对手,这种身份的转变揭示了大模型战争已经进入了“深水区”。它需要更庞大的资本杠杆来支撑其持续的成本破坏力,并利用这些资金去构筑除了模型本身之外的商业护城河,比如更深度的行业解决方案和更高壁垒的算力云服务。
让“智能”成为基础设施
DeepSeek-V4的发布方式,几乎是一种刻意的克制。但正是这种克制,使其形成了与行业主流叙事的对比。
过去一年,大模型行业充斥着参数规模、演示效果与生态叙事的竞争,而V4更像是在用一张价格表重写规则。它所传递的信息并不复杂:如果“智能”无法以足够低的成本被调用,那么它就难以成为真正的生产要素。
对于其他厂商而言,这种压力是持续且具体的。如果既无法在性能上形成代际优势,又无法在成本上接近DeepSeek,那么依赖销售体系或生态绑定的模式,将面临边际效应递减。
大模型行业或许正在接近一个临界点。不是因为产品形态的颠覆,而是因为成本曲线第一次出现了向下的拐点。当“智能”的价格开始接近基础设施,它所改变的,将不只是AI行业本身。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/15444