OpenAI Codex 发布全新特性 /goal：长时域模式来了，AI 编码 Agent 终于能“打持久战”了！

2026 年 5 月，OpenAI Codex CLI 0.128.0 版本悄然上线了一个看似不起眼的功能：/goal。结果社区直接炸锅了。有人半夜扔个目标给它，第二天醒来发现 18 个特性干了 14 个，还顺手开了 PR、自审代码、跑通 CI，就差给你泡杯咖啡了。作为开发者老兵了，我得说：这不是又一个“聪明一点的聊天命令”，而是 OpenAI 把从“短跑选手”升级成“马拉松选手”的关键一步。

golang学习记

524人浏览 · 2026-05-09 07:00:00

golang学习记 · 2026-05-09 07:00:00 发布

2026 年 5 月，OpenAI Codex CLI 0.128.0 版本悄然上线了一个看似不起眼的功能：/goal。结果社区直接炸锅了。有人半夜扔个目标给它，第二天醒来发现 18 个特性干了 14 个，还顺手开了 PR、自审代码、跑通 CI，就差给你泡杯咖啡了。

作为开发者老兵了，我得说：这不是又一个“聪明一点的聊天命令”，而是 OpenAI 把 Agentic Coding（智能体编码） 从“短跑选手”升级成“马拉松选手”的关键一步。

一、先搞懂 /goal 到底是啥？

以前用 AI 编码工具像指挥临时工：

你说：“帮我改下登录模块。”
它改两行，干完活儿就“摸鱼”了，等你下一条指令。

/goal 命令改变了游戏规则：你一次性告诉它一个持久目标（durable objective），它就会把这个目标当成“数据库里的一行记录”，持续追着干，直到完成、暂停、预算用完或者卡住。

在这里插入图片描述

官方描述是：“persisted /goal workflows with app-server APIs, model tools, runtime continuation, and TUI controls for create, pause, resume, and clear”。翻译成人话：它给 Agent 装了个带生命周期的状态机。

怎么用？超级简单（在 Codex CLI 的 TUI 里）：

/goal 迁移这个包到新 API 版本，并验证所有调用
/goal 把我 backlog.md 里的 18 个特性全干完
/goal pause / /goal resume / /goal clear

在这里插入图片描述

它支持跨会话、跨中断、预算软停止，真正实现了“长时域”（Long-Horizon）工作。

以前 AI Agent 像金鱼，7 秒记忆就忘。现在它终于有了“待办事项清单”和闹钟，不会半路跑去刷抖音了。

二、为什么说这是 Agentic Coding 的里程碑？

OpenAI 把 Codex 定位成“帮你真正构建和交付的编码 Agent”，而不是单纯的代码补全工具。它能读代码库、跑命令、写特性、修 Bug、提 PR，还在隔离环境里执行。

/goal 的核心价值在于持久状态 + 自主循环：

持久化：目标记录在线程状态里，不会因为你关终端就忘。
自主延续：空闲时自动继续（但尊重你的新输入）。
软停止：Token 预算用完不会直接崩溃，而是总结进度、标记“budget_limited”。
用户控制：随时 pause/resume/clear，安全第一。

真实案例：有人扔了个 18 特性 backlog，睡一觉起来 14 个已完成、CI 绿灯、自审 PR 就绪，总花费才 4.2 美元。

这才是 AI 该干的事——当靠谱的“实习生团队”，而不是需要你每 5 分钟喊一次“继续啊兄弟”。以前的 Agent 像需要保姆的宝宝，现在它终于能自己刷牙洗脸了（当然，代码还得你 review，别全信）。

三、底层是怎么实现的？

OpenAI 居然用了5 个 PR 才把这功能稳稳落地：

持久化状态（Rust 模型 + 数据库表）：记录目标、状态（active/paused/complete）、用量等。
App-Server API：支持同步、通知、断线重连。
模型工具：Agent 能看到目标、标记完成，但不能乱改（权限控制很严）。
运行时逻辑：处理继续、打断、预算、软停止。
TUI 界面：显示进度、控制按钮、耗时和预算。

这种“用户-模型-运行时-UI”的权力分离设计非常成熟。它不像某些 Agent 直接放飞自我，而是把人类始终放在循环里（Human-in-the-Loop）。这点我特别欣赏——AI 强大，但责任还是人的。

对比其他工具：很多 Agent 需要你反复 prompt 续命，Codex /goal 直接把“目标”变成了第一公民。长时域能力（能跑几小时到几天）正在成为新战场，METR 等基准也显示 Agent 可完成任务的时长在快速翻倍。

四、实际能干啥？

适合的任务（官方和社区例子）：

大型重构 / API 迁移
提升测试覆盖率直到关键路径达标
修复一堆 flaky 测试
根据 backlog 完整交付特性
复杂 Bug 的 reproduce → fix → verify 循环

这东西最适合“想躺平但又不想被老板发现”的开发者（开玩笑）。认真说，它把“从idea到ship”的周期大大缩短，让人类能专注在架构、创新和最终把关上。AI 干苦力，人干有意思的事——这才是正确未来！

但我也要泼点冷水：

代码质量仍需人工 review（别直接 merge 上线）。
预算和幻觉问题依然存在，长跑中偶尔会“跑偏”。
企业级安全、权限控制还在迭代中。

总体乐观：/goal + GPT-5.x Codex 的组合，正在把“Agentic”从概念变成日常生产力。

五、未来展望

/goal 不是孤立功能，而是 OpenAI 向“真正自主编码伙伴”迈进的信号。结合 Codex App 的工作树（worktrees）、并行线程、Skills 和 Automations，未来开发者可能真正实现“扔个目标，周末回来看成果”。

在 2026 年，模型参数还在卷，但时域长度（how long it can stay useful） 才是真正的分水岭。Codex /goal 把这个维度正式产品化了，值得所有开发者去试。

它提醒我们：AI 的进步不只在“更聪明”，更在“更持久、更可控、更像靠谱同事”。

北京朝阳AI社区

更多推荐

AI-Agents-01-初识智能体

本文为个人学习笔记整理，项目来源。

北京朝阳AI社区

别再只做一个 ChatDemo 了：`gijela-core-chat` 把大模型联调、知识库、图谱、附件、MCP、日志全串起来了

摘要： gijela-core-chat 是一个专为 Java 大模型项目设计的联调工作台，解决了传统开发中模型切换混乱、RAG 验证分散、日志排障困难等问题。其核心价值在于整合了 LLM 调用、知识库管理、图谱抽取、附件处理等全链路能力，提供可视化操作界面，支持同步/流式验证、会话管理、实时预览等功能。通过自研 OkHttp 工具链替代第三方框架，实现了可控的模型调用与调试闭环，显著提升了开发效