DeepSeek V4 来了
2026年4月24日,DeepSeek 发布了新一代模型 V4。这次有两个版本:V4-Pro 和 V4-Flash,都已经上线了,而且权重也开源了。
你可以去官网 chat.deepseek.com 或者官方 App 直接跟 V4 聊天。API 也同步更新了,开发者可以直接调用。
新模型有什么不一样
一、1M 超长上下文
V4 系列标配了 100 万 token 的上下文记忆。这意味着你可以一次性把整本《三体》三部曲(大概90万字)丢给它,它都能记住。技术上用了新的 token 压缩和 DSA 稀疏注意力,算起来比老方案快不少。
二、两个版本,看你怎么选
V4-Pro 和 V4-Flash 的区别很简单:
V4-Pro:总参数 1.6T,激活参数 49B。适合对性能要求高的场景,比如复杂推理、写代码、做分析。
V4-Flash:更轻更快更便宜。适合日常使用,响应快,成本低。
三、Agent 能力很强
DeepSeek 说 V4 的 Agent 能力是目前开源里最强的。他们内部已经用上了,用下来体验比 Sonnet 4.5 好,跟 Opus 4.6 的非思考模式差不多。如果你在做 AI Agent 相关的开发,这个值得试试。
四、推理性能领先
在所有公开评测里,V4 的推理表现超过了其他开源模型,跟顶级的闭源模型差不多。代码生成、数学推理这些方面提升明显。
怎么使用?
在线体验
直接打开 chat.deepseek.com 或者下载官方 App,选 V4 模型就能开始聊了。
API 调用
如果你之前用过 DeepSeek 的 API,base_url 不用变,只需要把 model 参数改成下面其中一个:
deepseek-v4-pro
deepseek-v4-flash
API 支持两种模式:思考模式(带推理过程)和非思考模式(直接出答案)。默认是开启思考模式的,你也可以自己关掉。
下面是一个简单的 Python 调用例子:
from openai import OpenAI
client = OpenAI(
api_key="你的API密钥",
base_url="https://api.deepseek.com"
)
messages = [{"role": "user", "content": "解释一下什么是稀疏注意力"}]
response = client.chat.completions.create(
model="deepseek-v4-pro",
messages=messages,
reasoning_effort="high", # 思考强度,可以选 high 或 max
extra_body={"thinking": {"type": "enabled"}} # 开启思考模式
)
# 拿到思维链和最终答案
reasoning = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content
print("思考过程:", reasoning)
print("回答:", answer)如果你不想看思考过程,把 {"thinking": {"type": "disabled"}} 就行。
需要注意的事情
有一点要提醒你:老模型的名字 deepseek-chat 和 deepseek-reasoner 会在三个月后停用,也就是 2026 年 7 月 24 日。如果你还在用旧名字,记得在这个日期前改成新的。
相关链接
如果你要下载模型权重:
国际用户:去 HuggingFace,链接是 https://huggingface.co/collections/deepseek-ai/deepseek-v4
国内用户:用 ModelScope 镜像,速度更快,链接是 https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
技术报告也在 HuggingFace 上,想了解细节的可以去读:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
API 详细文档在这里,包括思考模式怎么调、多轮对话怎么拼接、工具调用怎么用:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
总结
DeepSeek V4 这次升级挺实在的:上下文更长,算得更快,Agent 能力更强,还开源了。无论是普通用户拿来聊天,还是开发者做应用、搞 Agent,都可以试试。三个月内老名字还能用,但最好早点换到新模型。
本文内容仅供个人学习、研究或参考使用,不构成任何形式的决策建议、专业指导或法律依据。未经授权,禁止任何单位或个人以商业售卖、虚假宣传、侵权传播等非学习研究目的使用本文内容。如需分享或转载,请保留原文来源信息,不得篡改、删减内容或侵犯相关权益。感谢您的理解与支持!