OpenAI Codex 发布全新特性 /goal:长时域模式来了,AI 编码 Agent 终于能“打持久战”了!
2026 年 5 月,OpenAI Codex CLI 0.128.0 版本悄然上线了一个看似不起眼的功能:/goal。结果社区直接炸锅了。有人半夜扔个目标给它,第二天醒来发现 18 个特性干了 14 个,还顺手开了 PR、自审代码、跑通 CI,就差给你泡杯咖啡了。作为 开发者老兵了,我得说:这不是又一个“聪明一点的聊天命令”,而是 OpenAI 把从“短跑选手”升级成“马拉松选手”的关键一步。
2026 年 5 月,OpenAI Codex CLI 0.128.0 版本悄然上线了一个看似不起眼的功能:/goal。结果社区直接炸锅了。有人半夜扔个目标给它,第二天醒来发现 18 个特性干了 14 个,还顺手开了 PR、自审代码、跑通 CI,就差给你泡杯咖啡了。
作为 开发者老兵了,我得说:这不是又一个“聪明一点的聊天命令”,而是 OpenAI 把 Agentic Coding(智能体编码) 从“短跑选手”升级成“马拉松选手”的关键一步。
一、先搞懂 /goal 到底是啥?
以前用 AI 编码工具像指挥临时工:
- 你说:“帮我改下登录模块。”
- 它改两行,干完活儿就“摸鱼”了,等你下一条指令。
/goal 命令改变了游戏规则:你一次性告诉它一个持久目标(durable objective),它就会把这个目标当成“数据库里的一行记录”,持续追着干,直到完成、暂停、预算用完或者卡住。

官方描述是:“persisted /goal workflows with app-server APIs, model tools, runtime continuation, and TUI controls for create, pause, resume, and clear”。翻译成人话:它给 Agent 装了个带生命周期的状态机。
怎么用?超级简单(在 Codex CLI 的 TUI 里):
/goal 迁移这个包到新 API 版本,并验证所有调用/goal 把我 backlog.md 里的 18 个特性全干完/goal pause//goal resume//goal clear

它支持跨会话、跨中断、预算软停止,真正实现了“长时域”(Long-Horizon)工作。
以前 AI Agent 像金鱼,7 秒记忆就忘。现在它终于有了“待办事项清单”和闹钟,不会半路跑去刷抖音了。
二、为什么说这是 Agentic Coding 的里程碑?
OpenAI 把 Codex 定位成“帮你真正构建和交付的编码 Agent”,而不是单纯的代码补全工具。它能读代码库、跑命令、写特性、修 Bug、提 PR,还在隔离环境里执行。
/goal 的核心价值在于持久状态 + 自主循环:
- 持久化:目标记录在线程状态里,不会因为你关终端就忘。
- 自主延续:空闲时自动继续(但尊重你的新输入)。
- 软停止:Token 预算用完不会直接崩溃,而是总结进度、标记“budget_limited”。
- 用户控制:随时 pause/resume/clear,安全第一。
真实案例:有人扔了个 18 特性 backlog,睡一觉起来 14 个已完成、CI 绿灯、自审 PR 就绪,总花费才 4.2 美元。
这才是 AI 该干的事——当靠谱的“实习生团队”,而不是需要你每 5 分钟喊一次“继续啊兄弟”。以前的 Agent 像需要保姆的宝宝,现在它终于能自己刷牙洗脸了(当然,代码还得你 review,别全信)。
三、底层是怎么实现的?
OpenAI 居然用了5 个 PR 才把这功能稳稳落地:
- 持久化状态(Rust 模型 + 数据库表):记录目标、状态(active/paused/complete)、用量等。
- App-Server API:支持同步、通知、断线重连。
- 模型工具:Agent 能看到目标、标记完成,但不能乱改(权限控制很严)。
- 运行时逻辑:处理继续、打断、预算、软停止。
- TUI 界面:显示进度、控制按钮、耗时和预算。
这种“用户-模型-运行时-UI”的权力分离设计非常成熟。它不像某些 Agent 直接放飞自我,而是把人类始终放在循环里(Human-in-the-Loop)。这点我特别欣赏——AI 强大,但责任还是人的。
对比其他工具:很多 Agent 需要你反复 prompt 续命,Codex /goal 直接把“目标”变成了第一公民。长时域能力(能跑几小时到几天)正在成为新战场,METR 等基准也显示 Agent 可完成任务的时长在快速翻倍。
四、实际能干啥?
适合的任务(官方和社区例子):
- 大型重构 / API 迁移
- 提升测试覆盖率直到关键路径达标
- 修复一堆 flaky 测试
- 根据 backlog 完整交付特性
- 复杂 Bug 的 reproduce → fix → verify 循环
这东西最适合“想躺平但又不想被老板发现”的开发者(开玩笑)。认真说,它把“从idea到ship”的周期大大缩短,让人类能专注在架构、创新和最终把关上。AI 干苦力,人干有意思的事——这才是正确未来!
但我也要泼点冷水:
- 代码质量仍需人工 review(别直接 merge 上线)。
- 预算和幻觉问题依然存在,长跑中偶尔会“跑偏”。
- 企业级安全、权限控制还在迭代中。
总体乐观:/goal + GPT-5.x Codex 的组合,正在把“Agentic”从概念变成日常生产力。
五、未来展望
/goal 不是孤立功能,而是 OpenAI 向“真正自主编码伙伴”迈进的信号。结合 Codex App 的工作树(worktrees)、并行线程、Skills 和 Automations,未来开发者可能真正实现“扔个目标,周末回来看成果”。
在 2026 年,模型参数还在卷,但时域长度(how long it can stay useful) 才是真正的分水岭。Codex /goal 把这个维度正式产品化了,值得所有开发者去试。
它提醒我们:AI 的进步不只在“更聪明”,更在“更持久、更可控、更像靠谱同事”。
更多推荐
所有评论(0)