2026 年 4 月 24 日,DeepSeek 发布全新系列模型 DeepSeek-V4 预览版,并同步开源。1M 超长上下文、Agent 能力增强、推理性能提升、Pro/Flash 双版本、API 同步上线。从产品来看,用户已经可以在 DeepSeek 官网和 App 中体验;对开发者来说,API 也已经开放,只需要把模型名改为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。
这一次发布, DeepSeek 正在把几个过去只属于前沿闭源模型的能力,重新压到开源与低成本使用区间里。
DeepSeek-V4 分成两个版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。
按照官方介绍,V4-Pro 是性能主力版本,总参数规模为 1.6T,每 token 激活参数为 49B;V4-Flash 则是更轻、更快、更经济的版本,总参数规模为 284B,每 token 激活参数为 13B。官方把 V4-Pro 定位为“性能比肩顶级闭源模型”,把 V4-Flash 定位为“快捷高效的经济之选”。
这个分层非常关键。
DeepSeek V4 正在尝试把两种需求拆开:复杂 Agent、代码工程、长文档推理交给 Pro;日常问答、轻量推理、简单自动化任务交给 Flash。这更像是把模型能力重新产品化。
DeepSeek 这次最醒目的升级,是 1M 上下文长度。
V4-Pro 与 V4-Flash 都支持 1M context length,最大输出上限为 384K,并同时支持 JSON Output、Tool Calls、Chat Prefix Completion 等能力。
这件事放在普通聊天里可能感知不强,但一旦进入实际工作流,影响将会非常明显。
一个企业知识库、一整个代码仓库、多份合同材料、一套产品需求文档、几十页论文资料,以前往往需要切片、检索、压缩,再交给模型处理。现在 1M 上下文意味着很多任务可以被更完整地放进模型窗口里,减少信息丢失,也减少“模型只看到局部材料”的问题。
DeepSeek-V4 采用新的注意力机制,在 token 维度进行压缩,并结合 DSA 稀疏注意力,以降低长上下文场景下的计算与显存需求。
V4 真正想解决的是“将 100 万 token塞进去以后,能不能用得起、跑得动、用得稳”。
DeepSeek 这次发布里反复强调 Agent 能力。
官方称,V4-Pro 相比前代模型在 Agent 能力上显著增强,在 Agentic Coding 评测中达到开源模型最佳水平;DeepSeek 还提到,V4 已经成为其内部员工使用的 Agentic Coding 模型,在评测反馈中,体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式仍有差距。
DeepSeek 没有只强调聊天、写作、数学题,而是把重点放在 Agentic Coding、代码任务、文档生成、工具调用 ,而这些更接近真实生产力的场景上。


DeepSeek-V4 针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品进行了适配和优化。API 文档中也给出了接入 OpenCode 的说明,并建议选择 DeepSeek-V4-Pro 模型。
V4 的目标是要进入代码编辑器、自动化工作流、企业文档系统和 Agent 框架里,成为可以持续执行任务的底座模型。
DeepSeek 依旧:把性能往上推,同时把价格往下压。
官方 API 价格页面显示,DeepSeek-V4-Flash 的缓存命中输入价格为 0.028 美元/百万 token,缓存未命中输入价格为 0.14 美元/百万 token,输出价格为 0.28 美元/百万 token;DeepSeek-V4-Pro 的缓存命中输入价格为 0.145 美元/百万 token,缓存未命中输入价格为 1.74 美元/百万 token,输出价格为 3.48 美元/百万 token。
这个价格结构很有攻击性。
V4-Pro 不是“白菜价”,但相比很多前沿闭源模型,仍然把高性能模型的调用门槛压低了一截。V4-Flash 则更明显,它面向的是高频、海量、成本敏感的应用场景,比如客服、批量文档处理、轻量代码辅助、信息抽取、内部知识问答等。
当模型能力足够接近前沿水平,而调用成本大幅下降时,很多原本不值得自动化的任务,就会突然变得值得自动化。
AI 产品的边界,往往不是由能力单独决定,而是由“能力 × 成本 × 延迟”共同决定。DeepSeek V4 的意义,也正在这个乘法里。
DeepSeek-V4 已经在 Hugging Face 上建立模型集合,包含 Flash Base、Flash、Pro Base、Pro 等多个版本。Hugging Face 页面显示,DeepSeek-V4 集合在发布后约 18 小时内已经获得大量关注,其中 DeepSeek-V4-Pro 为 1.6T 规模,DeepSeek-V4-Flash 页面也已上线。
开源权重和本地部署 DeepSeek-V4 模型开源链接: https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
DeepSeek-V4 技术报告: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
这也是 DeepSeek 与多数闭源厂商最大的差异。
闭源模型提供的是 API 能力,开发者只能在边界内调用;开源权重提供的是更深层的可控性,开发者可以围绕模型做微调、部署、适配、蒸馏、框架优化和行业方案改造。
除了模型本身,DeepSeek V4 这次还有一个外部关注点:华为昇腾芯片支持。
路透社报道称,DeepSeek V4 是适配华为芯片的新模型,华为表示其基于 Ascend 950 的超节点集群将全面支持 DeepSeek V4 系列模型,且部分 V4-Flash 训练使用了华为芯片。
这让 V4 的意义超出了单个模型。
大模型过去的竞争很大程度上依赖英伟达 GPU 生态。DeepSeek V4 与昇腾体系的适配,释放的是另一个信号:国产大模型与国产 AI 算力正在尝试形成更完整的闭环。AP 也提到,V4 的 Pro 和 Flash 版本在一定程度上由华为芯片支持,这有助于降低对美国芯片厂商的依赖。
当然这并不意味着国产算力生态已经完全追平英伟达。
但 V4 至少证明了模型、框架、芯片、部署环境之间的协同,正在成为中国 AI 产业接下来最重要的主线之一。
如果把 DeepSeek-R1 看作第一次冲击,V4 更像是一次体系化补课。
R1 的爆点在推理能力和成本冲击,它让全球市场第一次真正意识到,中国开源模型可以用更低成本逼近前沿模型。V4 的不同之处在于,它不是单点突破,而是把 长上下文、Agent、代码、推理、API 成本、开源权重、国产算力适配 放在同一张牌桌上。
AP 在报道中也提到,V4 是 V3 的后续版本,DeepSeek 声称 V4 在知识、推理和 Agent 能力上都有明显改进,但也有分析人士提醒,V4 是否能被视为又一次突破,还需要更多独立评测验证。
DeepSeek 官方评测给出的结果很强,但对于开发者和企业来说,真正的检验不会只发生在 benchmark 上,而会发生在代码仓库、合同审阅、数据分析、长期记忆、复杂工具链调用和多步骤任务执行里。
DeepSeek V4 的真正冲击,是把前沿能力继续拉向低成本区间。 最值得关注的地方,不是某一个榜单成绩,也不是某一句“比肩闭源模型”的宣传。
它真正的冲击在于开源模型正在继续压缩与闭源前沿模型之间的差距,同时把长上下文、Agent 执行、代码能力和低成本 API 打包成一个更可用的产品形态。
如果说过去的大模型竞争主要比谁更聪明,那么 DeepSeek V4 把问题进一步推向了另一个层面:
谁能让更强的模型被更多人、更便宜地、更深地接入真实工作流。
这才是 V4 发布之后,整个 AI 产业最该盯紧的地方。