OpenAI 发布目前最强的两款小型模型

更新日期: 2026-03-19 阅读: 120 标签: ChatGPT 分享

OpenAI 正式发布了两款新的小型 AI 模型，分别是 GPT-5.4 mini 和 GPT-5.4 nano。这两款模型是在 3 月 17 号推出的，主要想解决一个实际问题：在真实的生产环境里，怎么让 AI 跑得又快又准，同时还很便宜。

以前我们总觉得模型越大越聪明，但现在情况变了。这两款小模型针对的是那些使用频率高、对响应速度要求高的任务场景，说白了，就是让 AI 能更好地去干活，而不是只会聊天。

两款新模型，分工很明确

这次发布的虽然都是小模型，但干的活不太一样。

先说 GPT-5.4 mini，你可以把它看作这次发布的"明星产品"。它在写代码、逻辑推理、理解图片这些核心能力上，比上一代的 GPT-5 mini 强了一大截，运行速度更是快了两倍以上。有个叫 SWE-Bench Pro 的测试，专门衡量模型修复真实软件 Bug 的能力，mini 拿下了 54.4% 的分数，已经很接近旗舰版 GPT-5.4 的 57.7% 了。还有一个测试是看模型会不会像人一样操作电脑，比如看屏幕截图找按钮去点，mini 得了 72.1%，跟旗舰版的 75% 差不了多少。这说明，像实时 AI 助理这种需要快速响应的活，小模型现在也能干了。

再说 GPT-5.4 nano，它走的是另一个极端——极致轻量和便宜。它是 OpenAI 家族里个头最小、价格最低的模型，专门负责那些简单但量大的基础任务，比如给文本分类、从一堆数据里提取关键信息、或者给内容排序。有开发者测了一下，在处理上万次的分类任务时，用 nano 花的钱比用旗舰大模型省了超过九成。虽然便宜，但干活的效果还挺接近那些大模型。

这么设计，背后是有道理的

OpenAI 这次一口气推两个小模型，其实反映了整个 AI 行业正在发生的一个变化：与其用一个超级大模型包揽所有事，不如让不同大小的模型分工合作 。

这就好比一个成熟的物流公司，既要有跑长途的重型卡车，也要有在街头巷尾送货的无人机。大模型（比如 GPT-5.4）就相当于那个负责思考、规划和决策的"总指挥"。而那些具体的执行活儿，比如快速搜索一下代码库、处理一份文档、或者操作一下电脑界面，就可以交给 GPT-5.4 mini 或 nano 这样的"小工"去干，又快又便宜。

这种"大模型决策，小模型执行"的模式，好处很明显。它能让整个系统跑得更快，同时因为把合适的任务分给合适的模型，成本也降下来了，让大规模地部署一群 AI 智能体在商业上变得可行。四川大学研究 AI 的学者宋耀打了个比方，这就好比一个成熟的物流系统，既需要远程重型卡车，也需要末端配送的无人机。以后，你手机里的 App 可能会在后台悄悄地用这些小模型帮你处理各种事，而你根本感觉不到。

怎么用，要花多少钱

目前，GPT-5.4 mini 已经可以通过 API、Codex（OpenAI 的编程工具）和 ChatGPT 用上了。免费用户和 ChatGPT Go 用户可以通过"思考"这个功能体验到它。如果你用 API，mini 的价格是每百万 token 输入 0.75 美元，输出 4.5 美元。

GPT-5.4 nano 目前只能通过 API 使用，价格确实便宜，输入只要每百万 token 0.2 美元，输出 1.25 美元。做个对比，nano 的输入价格大概是 mini 的四分之一，输出价格不到 mini 的三分之一。

当然，小模型也有自己的短板。在处理超长文本或者需要很深逻辑推理的复杂任务上，mini 和 nano 跟旗舰版的差距还是比较明显的。这也正好说明了 OpenAI 的产品思路：不同任务，用不同模型，别指望一个模型干所有事。对于普通用户来说，这两款模型的推出意味着 AI 的响应会更快，以后也会有更多 App 能在不增加成本的情况下把 AI 功能集成进来，让 AI 真正变成一个随叫随到的隐形助手。

本文内容仅供个人学习、研究或参考使用，不构成任何形式的决策建议、专业指导或法律依据。未经授权，禁止任何单位或个人以商业售卖、虚假宣传、侵权传播等非学习研究目的使用本文内容。如需分享或转载，请保留原文来源信息，不得篡改、删减内容或侵犯相关权益。感谢您的理解与支持！

链接: https://fly63.com/article/detial/13452

上一页: 一人公司：从注册到赚钱，六个坑一次说清下一页: Vue3项目Pinia封装实战：模块化+持久化，一次搞定全局状态管理

内容以共享、参考、研究为目的,不存在任何商业目的。其版权属原作者所有,如有侵权或违规,请与小编联系!情况属实本人将予以删除!