2026 年 5 月,OpenAI Codex CLI 0.128.0 版本悄然上线了一个看似不起眼的功能:/goal。结果社区直接炸锅了。有人半夜扔个目标给它,第二天醒来发现 18 个特性干了 14 个,还顺手开了 PR、自审代码、跑通 CI,就差给你泡杯咖啡了。

作为 开发者老兵了,我得说:这不是又一个“聪明一点的聊天命令”,而是 OpenAI 把 Agentic Coding(智能体编码) 从“短跑选手”升级成“马拉松选手”的关键一步。

一、先搞懂 /goal 到底是啥?

以前用 AI 编码工具像指挥临时工:

  • 你说:“帮我改下登录模块。”
  • 它改两行,干完活儿就“摸鱼”了,等你下一条指令。

/goal 命令改变了游戏规则:你一次性告诉它一个持久目标(durable objective),它就会把这个目标当成“数据库里的一行记录”,持续追着干,直到完成、暂停、预算用完或者卡住。

在这里插入图片描述

官方描述是:“persisted /goal workflows with app-server APIs, model tools, runtime continuation, and TUI controls for create, pause, resume, and clear”。翻译成人话:它给 Agent 装了个带生命周期的状态机

怎么用?超级简单(在 Codex CLI 的 TUI 里):

  • /goal 迁移这个包到新 API 版本,并验证所有调用
  • /goal 把我 backlog.md 里的 18 个特性全干完
  • /goal pause / /goal resume / /goal clear

在这里插入图片描述

它支持跨会话、跨中断、预算软停止,真正实现了“长时域”(Long-Horizon)工作。

以前 AI Agent 像金鱼,7 秒记忆就忘。现在它终于有了“待办事项清单”和闹钟,不会半路跑去刷抖音了。

二、为什么说这是 Agentic Coding 的里程碑?

OpenAI 把 Codex 定位成“帮你真正构建和交付的编码 Agent”,而不是单纯的代码补全工具。它能读代码库、跑命令、写特性、修 Bug、提 PR,还在隔离环境里执行。

/goal 的核心价值在于持久状态 + 自主循环

  • 持久化:目标记录在线程状态里,不会因为你关终端就忘。
  • 自主延续:空闲时自动继续(但尊重你的新输入)。
  • 软停止:Token 预算用完不会直接崩溃,而是总结进度、标记“budget_limited”。
  • 用户控制:随时 pause/resume/clear,安全第一。

真实案例:有人扔了个 18 特性 backlog,睡一觉起来 14 个已完成、CI 绿灯、自审 PR 就绪,总花费才 4.2 美元。

这才是 AI 该干的事——当靠谱的“实习生团队”,而不是需要你每 5 分钟喊一次“继续啊兄弟”。以前的 Agent 像需要保姆的宝宝,现在它终于能自己刷牙洗脸了(当然,代码还得你 review,别全信)。

三、底层是怎么实现的?

OpenAI 居然用了5 个 PR 才把这功能稳稳落地:

  1. 持久化状态(Rust 模型 + 数据库表):记录目标、状态(active/paused/complete)、用量等。
  2. App-Server API:支持同步、通知、断线重连。
  3. 模型工具:Agent 能看到目标、标记完成,但不能乱改(权限控制很严)。
  4. 运行时逻辑:处理继续、打断、预算、软停止。
  5. TUI 界面:显示进度、控制按钮、耗时和预算。

这种“用户-模型-运行时-UI”的权力分离设计非常成熟。它不像某些 Agent 直接放飞自我,而是把人类始终放在循环里(Human-in-the-Loop)。这点我特别欣赏——AI 强大,但责任还是人的。

对比其他工具:很多 Agent 需要你反复 prompt 续命,Codex /goal 直接把“目标”变成了第一公民。长时域能力(能跑几小时到几天)正在成为新战场,METR 等基准也显示 Agent 可完成任务的时长在快速翻倍。

四、实际能干啥?

适合的任务(官方和社区例子):

  • 大型重构 / API 迁移
  • 提升测试覆盖率直到关键路径达标
  • 修复一堆 flaky 测试
  • 根据 backlog 完整交付特性
  • 复杂 Bug 的 reproduce → fix → verify 循环

这东西最适合“想躺平但又不想被老板发现”的开发者(开玩笑)。认真说,它把“从idea到ship”的周期大大缩短,让人类能专注在架构、创新和最终把关上。AI 干苦力,人干有意思的事——这才是正确未来!

但我也要泼点冷水:

  • 代码质量仍需人工 review(别直接 merge 上线)。
  • 预算和幻觉问题依然存在,长跑中偶尔会“跑偏”。
  • 企业级安全、权限控制还在迭代中。

总体乐观:/goal + GPT-5.x Codex 的组合,正在把“Agentic”从概念变成日常生产力。

五、未来展望

/goal 不是孤立功能,而是 OpenAI 向“真正自主编码伙伴”迈进的信号。结合 Codex App 的工作树(worktrees)、并行线程、Skills 和 Automations,未来开发者可能真正实现“扔个目标,周末回来看成果”。

在 2026 年,模型参数还在卷,但时域长度(how long it can stay useful) 才是真正的分水岭。Codex /goal 把这个维度正式产品化了,值得所有开发者去试。

它提醒我们:AI 的进步不只在“更聪明”,更在“更持久、更可控、更像靠谱同事”。

Logo

更多推荐