DeepSeek V4 来了

更新日期: 2026-04-24 阅读: 17 标签: AI

2026年4月24日,DeepSeek 发布了新一代模型 V4。这次有两个版本:V4-Pro 和 V4-Flash,都已经上线了,而且权重也开源了。

你可以去官网 chat.deepseek.com 或者官方 App 直接跟 V4 聊天。API 也同步更新了,开发者可以直接调用。


新模型有什么不一样

一、1M 超长上下文

V4 系列标配了 100 万 token 的上下文记忆。这意味着你可以一次性把整本《三体》三部曲(大概90万字)丢给它,它都能记住。技术上用了新的 token 压缩和 DSA 稀疏注意力,算起来比老方案快不少。

二、两个版本,看你怎么选

V4-Pro 和 V4-Flash 的区别很简单:

  • V4-Pro:总参数 1.6T,激活参数 49B。适合对性能要求高的场景,比如复杂推理、写代码、做分析。

  • V4-Flash:更轻更快更便宜。适合日常使用,响应快,成本低。

三、Agent 能力很强

DeepSeek 说 V4 的 Agent 能力是目前开源里最强的。他们内部已经用上了,用下来体验比 Sonnet 4.5 好,跟 Opus 4.6 的非思考模式差不多。如果你在做 AI Agent 相关的开发,这个值得试试。

四、推理性能领先

在所有公开评测里,V4 的推理表现超过了其他开源模型,跟顶级的闭源模型差不多。代码生成、数学推理这些方面提升明显。


怎么使用?

在线体验

直接打开 chat.deepseek.com 或者下载官方 App,选 V4 模型就能开始聊了。

API 调用

如果你之前用过 DeepSeek 的 API,base_url 不用变,只需要把 model 参数改成下面其中一个:

  • deepseek-v4-pro

  • deepseek-v4-flash

API 支持两种模式:思考模式(带推理过程)和非思考模式(直接出答案)。默认是开启思考模式的,你也可以自己关掉。

下面是一个简单的 Python 调用例子:

from openai import OpenAI

client = OpenAI(
    api_key="你的API密钥",
    base_url="https://api.deepseek.com"
)

messages = [{"role": "user", "content": "解释一下什么是稀疏注意力"}]

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=messages,
    reasoning_effort="high",  # 思考强度,可以选 high 或 max
    extra_body={"thinking": {"type": "enabled"}}  # 开启思考模式
)

# 拿到思维链和最终答案
reasoning = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content

print("思考过程:", reasoning)
print("回答:", answer)

如果你不想看思考过程,把 {"thinking": {"type": "disabled"}} 就行。


需要注意的事情

有一点要提醒你:老模型的名字 deepseek-chat 和 deepseek-reasoner 会在三个月后停用,也就是 2026 年 7 月 24 日。如果你还在用旧名字,记得在这个日期前改成新的。


相关链接

如果你要下载模型权重:

  • 国际用户:去 HuggingFace,链接是 https://huggingface.co/collections/deepseek-ai/deepseek-v4

  • 国内用户:用 ModelScope 镜像,速度更快,链接是 https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

技术报告也在 HuggingFace 上,想了解细节的可以去读:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

API 详细文档在这里,包括思考模式怎么调、多轮对话怎么拼接、工具调用怎么用:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode


总结

DeepSeek V4 这次升级挺实在的:上下文更长,算得更快,Agent 能力更强,还开源了。无论是普通用户拿来聊天,还是开发者做应用、搞 Agent,都可以试试。三个月内老名字还能用,但最好早点换到新模型。

本文内容仅供个人学习、研究或参考使用,不构成任何形式的决策建议、专业指导或法律依据。未经授权,禁止任何单位或个人以商业售卖、虚假宣传、侵权传播等非学习研究目的使用本文内容。如需分享或转载,请保留原文来源信息,不得篡改、删减内容或侵犯相关权益。感谢您的理解与支持!

链接: https://fly63.com/article/detial/13706

相关推荐

手把手教你用扣子(Coze)打造AI工作流:3分钟轻松上手

工作流就像一条流水线,把完整任务拆分成多个小步骤,然后按照特定顺序和逻辑组合起来。我们日常生活中其实到处都是工作流的例子。只要是这种规律性的工作流程,都可以尝试用AI工作流来实现自动化。

热门 AI 编程工具有哪些?哪款更适合你?

在科技飞速发展的当下,AI 编程工具已成为广大程序员的得力助手。这些工具不仅能大幅提升编程效率,还能降低编程的难度。如果你还没用过这些工具,可能会在开发效率上落后于别人。

TypeScript开发AI应用,正成为越来越多人的选择

AI技术正在快速发展,越来越多的开发者开始构建基于大语言模型(LLM)、多智能体协作、浏览器端直接推理的新应用。在这个趋势下,TypeScript 凭借其优秀的类型检查、完善的工具支持和活跃的社区

Google Anti-Gravity:重新认识AI编程工具

Google随着Gemini 3悄悄发布的这个工具,目前所有用户都能免费使用(预览版),但使用额度消耗很快。趁着还能免费试用,我把最值得关注的5个功能整理出来。

AI 浪潮下的程序员生存法则:当工具进化,人类如何守住创造力高地

作为一名在代码世界摸爬滚打八年的程序员,我的工位曾堆满了各类技术书籍,如今屏幕上最常亮的却是 Copilot、ChatGPT 这些 AI 工具的界面。从 2023 年底被朋友 拽入 AI 大门

用好豆包AI的秘诀:这个万能指令公式真管用

很多人用豆包AI时总觉得效果不理想,不是内容太笼统,就是格式不对。其实问题往往出在指令上。指令写得好,AI才能准确理解你的需求。经过多次实践,我总结出一个万能指令公式,能大大提高AI输出的质量。

豆包AI创富5步法:从0开始,不用花钱就能赚钱

很多人一提到赚钱、创业,就觉得特别难——要花钱、要人脉、要有经验、要懂很多东西。但在AI时代,这些门槛正在消失。用豆包这样的AI工具,普通人也能零成本、零风险地开始赚钱。

为AI桌面应用选择合适的技术方案:多角度对比分析

在规划AI应用开发时,我们经常面临技术选型的难题。特别是当应用需要深度整合本地电脑环境,实现自动化场景时,传统的Web应用往往无法满足需求。这时候,桌面客户端技术就成为更合适的选择。

VSCode 宣布改名!全面 AI 的时代到来!

这绝非临时起意,而是微软应对AI浪潮的主动出击。2025年初,Cursor、Claude Code等AI编辑器异军突起,分流传统编辑器市场份额。微软选择开源AI组件,既守住VS Code的社区基本盘,又靠协作迭代甩开封闭开发的桎梏,避免被新兴工具边缘化

TypeScript超越Python:AI时代开发者选择的新变化

近年来,Python一直是开发者心中的热门语言,在数据科学、机器学习和Web开发领域都占据重要位置。但最新的GitHub统计数据显示,TypeScript已经超越Python,成为平台上使用最广泛的语言之一。

点击更多...

内容以共享、参考、研究为目的,不存在任何商业目的。其版权属原作者所有,如有侵权或违规,请与小编联系!情况属实本人将予以删除!