Codex有哪些功能?2026最新版16大核心功能体验评测
Codex有哪些功能?2026最新版16大核心功能体验评测

如果你最近一直在用 Codex,大概率会发现它已经不是当初那个"写几行代码"的 AI 了。
插件、自动化、Computer Use、Plan、Browser、Worktree、Memory……功能越来越多。
问题来了:
哪些功能是真正每天都在用?哪些功能只是发布会看着很酷?
本文就按照个人实际使用体验,纯客观点评一下 Codex 目前比较核心的 16 个功能。
为了方便理解,我把它们分成几个等级:
| 等级 | 含义 |
|---|---|
| 🔥 夯 | 没有它几乎不想用 Codex |
| ⭐ 顶级 | 非常强,使用频率高 |
| 👍 人上人 | 高级玩家会特别喜欢 |
| 😐 NPC | 有用,但不是刚需 |
| 👀 拉 | 有意思,但生产力有限 |
仅代表个人体验,不代表绝对结论。
Codex客户端下载:https://codexdown.cn/
1.Go(长期目标)
评分:👍 人上人
以前的 Codex 很像临时工。
你说一句,它干一步。
然后马上问:
下一步呢?
Go 出来以后,可以给 Codex 一个长期目标。
例如:
- 重构整个项目
- 完成版本迁移
- 整理大量文件
- 修复多个 Bug
它会尽量一直往目标推进,而不是每几分钟停下来等你。
优点
- 长任务体验提升明显
- 不需要反复补充背景
- 更接近真正的 Agent
缺点
特别吃 Prompt。
例如:
做高级一点
优化一下体验
这种描述基本等于让 AI 猜谜。
写得越具体,效果越好。
2.Computer Use(电脑操作)
评分:👍 人上人
这是 Codex 最有代表性的能力之一。
它可以:
- 看屏幕
- 点击按钮
- 输入文字
- 操作桌面软件
- 浏览网页
- 控制模拟器
终于补上了以前 GUI 世界的空白。
以前很多事情:
API 做不了。
MCP 做不了。
命令行更做不了。
现在至少 AI 能亲自去点。
缺点也很明显
它不是调用接口。
而是在看屏幕猜界面。
所以会出现:
- 找不到按钮
- 弹窗挡住
- 焦点丢失
- 页面加载慢
- 窗口切换
整体速度也不快。
更重要的是,它不会替你越权操作。
所以目前来看:
能用,但距离完全自动还有距离。
3.Automation(自动化)
评分:👍 人上人
这个功能很适合重复任务。
例如:
- 定时检查部署
- 扫描项目状态
- 检查依赖更新
- 定期整理结果
真正适合:
重复且规则固定。
最大误区
自动化不会把烂流程变成好流程。
它只会:
准时重复你的烂流程。
如果本身就需要大量人工判断。
自动化只会稳定地产生更多垃圾。
4.插件(Plugins)
评分:🔥 夯
这是目前我认为最重要的能力之一。
没有插件。
Codex 就只是一个写代码的 AI。
有插件以后。
它开始真正进入工作流。
例如:
- Browser
- GitHub
- Figma
- Product Design
- Slides
- Spreadsheet
这些插件已经覆盖了很多真实办公场景。
相比官方插件。
其实我更推荐:
自己写 Skills。
针对自己的工作流,效率往往更高。
5.MCP
评分:😐 NPC
MCP 本质就是:
让 Codex 能连接真实世界。
例如:
- 文档
- 浏览器
- GitHub
- Figma
- 数据库
以前 AI 最大的问题:
不是不会回答。
而是不知道你的项目里发生了什么。
MCP 就是在补这一块。
为什么评分不高?
因为很多插件已经把 MCP 封装好了。
普通用户:
几乎不用自己配置。
真正自己搭 MCP:
认证、权限、连接、上下文……
复杂度并不低。
6.Browser(浏览器)
评分:⭐ 顶级
对于前端来说。
几乎属于必备。
以前:
AI 改页面。
全靠脑补。
现在:
它能:
- 打开页面
- 查看效果
- 截图
- 重新修改
甚至还能结合批注。
真正做到:
哪里有问题。
改哪里。
唯一限制:
应用内浏览器不会继承你的登录状态。
涉及登录网站。
还是需要 Chrome 等其它方式。
7.Pets(桌面宠物)
评分:👀 拉
可以选择官方宠物。
也可以安装 CQ 自定义宠物。
很可爱。
情绪价值拉满。
生产力基本没有。
Bug 不会因为宠物可爱就少一个。
属于:
每天看着开心一点。
8.Worktree(工作树)
评分:⭐ 顶级
这是 Git 玩家会非常喜欢的功能。
一个项目。
可以开多个独立工作区。
例如:
- 修 Bug
- 做实验
- 重构
- 自动化
互不影响。
Codex 在后台折腾。
你继续开发。
最后 Hand Off 即可。
缺点就是:
Git 复杂度会上升。
新手容易懵。
9.Record & Replay
评分:⭐ 顶级
Mac 上可以演示一次流程。
Codex 学会以后。
直接变成 Skill。
这是我很看好的方向。
以后教 AI:
未必要写 Prompt。
也可以:
看我做一遍。
例如:
- 发视频
- 创建 Issue
- 固定后台流程
学习成本反而更低。
10.Branch(派生)
评分:👍 人上人
相当于:
当前对话开一个平行世界。
保留原上下文。
尝试另一种方案。
例如:
- 一个线程修 Bug
- 一个线程重构
- 一个线程做实验
不会互相污染。
缺点:
容易开一堆没人收尾的线程。
11.AGENTS.md
评分:🔥 夯
这是最容易被忽略。
也是最值得写的。
它相当于:
项目说明书。
告诉 Codex:
- 怎么构建
- 怎么测试
- 哪些地方不能改
- 编码规范
- 工作流程
很多人说:
AI 不懂项目。
其实项目自己也没文档。
那 AI 当然只能猜。
真正稳定的团队。
建议认真维护 AGENTS.md。
12.Codex Mobile
评分:😐 NPC
很多人误以为:
手机写代码。
其实不是。
真正用途:
远程批准任务。
例如:
电脑正在跑。
Codex 请求确认。
你手机点一下即可。
环境仍然来自电脑。
不是手机开发。
13.Plan 模式
评分:⭐ 顶级
这个功能建议复杂任务一定开。
它会:
先分析。
再提方案。
最后执行。
避免:
一句话没说清。
AI 已经重构整个项目。
当然。
如果只是:
改文案。
修拼写。
再规划三阶段。
就有点过度设计了。
14.批注(Annotation)
评分:👍 人上人
浏览器最大的搭档。
可以:
截图。
圈选。
写批注。
例如:
这里按钮太小。
这里挡住内容。
这里间距不对。
以前:
“这里有点怪”
属于玄学。
现在:
直接变成坐标。
对于前端调 UI。
非常实用。
15.Memory(记忆)
评分:😐 NPC
可以记住:
- 偏好
- 常用流程
- 技术栈
- 一些习惯
减少重复解释。
但不要把它当制度。
真正重要的规则。
还是应该:
写进 AGENTS.md。
Memory 更像辅助。
不是项目规范。
16.Side Chat(侧边聊天)
评分:⭐ 顶级
Cloud Code 很早就有类似思路。
Codex 现在也加入了。
它最大的价值:
主任务继续跑。
你可以旁边单独问:
- 做到哪了?
- 为什么这样改?
- 当前状态?
- 这个错误严重吗?
不用打断整个任务。
对于长任务体验提升非常明显。
没写 Skills?
不是忘了。
而是因为:
Skills 已经不能用"夯"来形容了。
它几乎决定了:
Codex 最终到底只是聊天机器人。
还是一个真正懂你工作流的 Agent。
很多高频操作。
最终都会沉淀成自己的 Skills。
这一点的重要性,很难用一个等级去评价。
我的最终排名
| 功能 | 评级 |
|---|---|
| Plugins | 🔥 夯 |
| AGENTS.md | 🔥 夯 |
| Browser | ⭐ 顶级 |
| Worktree | ⭐ 顶级 |
| Record & Replay | ⭐ 顶级 |
| Plan Mode | ⭐ 顶级 |
| Side Chat | ⭐ 顶级 |
| Go | 👍 人上人 |
| Computer Use | 👍 人上人 |
| Automation | 👍 人上人 |
| Branch | 👍 人上人 |
| Annotation | 👍 人上人 |
| MCP | 😐 NPC |
| Mobile | 😐 NPC |
| Memory | 😐 NPC |
| Pets | 👀 拉 |
总结
如果把 Codex 当成一个代码补全工具,很多功能确实显得复杂。
但如果把它定位为一个能够参与开发流程的 AI Agent,那么插件、项目规范、浏览器、规划模式、工作树等能力,会逐渐成为日常工作的一部分。
真正影响效率的,往往不是某一个单独功能,而是这些能力组合后的工作流。对于不同类型的开发者,各功能的重要程度也会有所不同,因此上面的评级更适合作为一种使用体验分享,而不是固定结论。
更多推荐


所有评论(0)