OpenAI 发布目前最强的两款小型模型
OpenAI 正式发布了两款新的小型 AI 模型,分别是 GPT-5.4 mini 和 GPT-5.4 nano。这两款模型是在 3 月 17 号推出的,主要想解决一个实际问题:在真实的生产环境里,怎么让 AI 跑得又快又准,同时还很便宜 。
以前我们总觉得模型越大越聪明,但现在情况变了。这两款小模型针对的是那些使用频率高、对响应速度要求高的任务场景,说白了,就是让 AI 能更好地去干活,而不是只会聊天 。
两款新模型,分工很明确
这次发布的虽然都是小模型,但干的活不太一样。
先说 GPT-5.4 mini,你可以把它看作这次发布的"明星产品"。它在写代码、逻辑推理、理解图片这些核心能力上,比上一代的 GPT-5 mini 强了一大截,运行速度更是快了两倍以上 。有个叫 SWE-Bench Pro 的测试,专门衡量模型修复真实软件 Bug 的能力,mini 拿下了 54.4% 的分数,已经很接近旗舰版 GPT-5.4 的 57.7% 了 。还有一个测试是看模型会不会像人一样操作电脑,比如看屏幕截图找按钮去点,mini 得了 72.1%,跟旗舰版的 75% 差不了多少 。这说明,像实时 AI 助理这种需要快速响应的活,小模型现在也能干了。
再说 GPT-5.4 nano,它走的是另一个极端——极致轻量和便宜。它是 OpenAI 家族里个头最小、价格最低的模型,专门负责那些简单但量大的基础任务,比如给文本分类、从一堆数据里提取关键信息、或者给内容排序 。有开发者测了一下,在处理上万次的分类任务时,用 nano 花的钱比用旗舰大模型省了超过九成 。虽然便宜,但干活的效果还挺接近那些大模型。
这么设计,背后是有道理的
OpenAI 这次一口气推两个小模型,其实反映了整个 AI 行业正在发生的一个变化:与其用一个超级大模型包揽所有事,不如让不同大小的模型分工合作 。
这就好比一个成熟的物流公司,既要有跑长途的重型卡车,也要有在街头巷尾送货的无人机 。大模型(比如 GPT-5.4)就相当于那个负责思考、规划和决策的"总指挥"。而那些具体的执行活儿,比如快速搜索一下代码库、处理一份文档、或者操作一下电脑界面,就可以交给 GPT-5.4 mini 或 nano 这样的"小工"去干,又快又便宜 。
这种"大模型决策,小模型执行"的模式,好处很明显。它能让整个系统跑得更快,同时因为把合适的任务分给合适的模型,成本也降下来了,让大规模地部署一群 AI 智能体在商业上变得可行 。四川大学研究 AI 的学者宋耀打了个比方,这就好比一个成熟的物流系统,既需要远程重型卡车,也需要末端配送的无人机 。以后,你手机里的 App 可能会在后台悄悄地用这些小模型帮你处理各种事,而你根本感觉不到。
怎么用,要花多少钱
目前,GPT-5.4 mini 已经可以通过 api、Codex(OpenAI 的编程工具)和 ChatGPT 用上了 。免费用户和 ChatGPT Go 用户可以通过"思考"这个功能体验到它 。如果你用 API,mini 的价格是每百万 token 输入 0.75 美元,输出 4.5 美元 。
GPT-5.4 nano 目前只能通过 API 使用,价格确实便宜,输入只要每百万 token 0.2 美元,输出 1.25 美元 。做个对比,nano 的输入价格大概是 mini 的四分之一,输出价格不到 mini 的三分之一 。
当然,小模型也有自己的短板。在处理超长文本或者需要很深逻辑推理的复杂任务上,mini 和 nano 跟旗舰版的差距还是比较明显的 。这也正好说明了 OpenAI 的产品思路:不同任务,用不同模型,别指望一个模型干所有事。对于普通用户来说,这两款模型的推出意味着 AI 的响应会更快,以后也会有更多 App 能在不增加成本的情况下把 AI 功能集成进来,让 AI 真正变成一个随叫随到的隐形助手 。
本文内容仅供个人学习、研究或参考使用,不构成任何形式的决策建议、专业指导或法律依据。未经授权,禁止任何单位或个人以商业售卖、虚假宣传、侵权传播等非学习研究目的使用本文内容。如需分享或转载,请保留原文来源信息,不得篡改、删减内容或侵犯相关权益。感谢您的理解与支持!