告别繁琐重复工作:Codex Record & Replay功能深度解析
阅读之前记得关注、星标⭐️,每天才能第一时间接收到更新。
我最近会持续写Codex、AI Agent和个人自动化系统,真实流程、提示词和踩坑记录。
6月18日,Codex App发布重磅功能Record & Replay。

翻译过来就是录制加复现。这个功能可以简单理解成:你在电脑上把一件事做一遍,Codex在旁边看,录完后把这套流程整理成一个可复用的skill。下次再做同类任务,你只需要告诉它这次的输入有什么变化,剩下的让它按skill执行。
这和普通录屏不一样。录屏只是把画面存下来,Record & Replay要做的是把操作过程转成Codex能复用的流程。
它能解决什么问题?
很多工作流都卡在一个尴尬的地方:写程序实现太费时,手动做又麻烦。
比如:
-
下载后台报表
-
创建固定格式工单
-
把一个系统里的信息录入另一个系统
-
每周按固定格式整理一次材料
这些事不难,但重复而繁琐。
它们也不太适合直接写死脚本。很多内部系统没有开放API,还依赖浏览器登录态、文件选择器、页面文案、动态识别结果和最终提交状态。
传统RPA(机器人流程自动化)可以录制操作,但通常更像“复刻点击”。页面稍微变一下,流程就不能用了。
Record & Replay的思路不一样。它会把一次演示整理成一份Agent能读懂的操作说明,而不只是记录鼠标轨迹。
这个功能的优势在哪?
它的优势主要有三点:
-
理论上,它可以操作电脑上的任何软件。浏览器、桌面客户端、文件选择器都能纳入流程,前提是软件本身没有强风控。
-
它不依赖传统RPA 工具,也不是按固定坐标复刻点击。按钮位置变了,只要页面元素、文案和上下文还清楚,流程就有机会继续跑。
-
Skill 是按用户真实操作流程生成的。你怎么做,它就按这个路径沉淀说明,比从零写Skill更快,也更贴近真实场景。
怎么使用?
整个流程分4步。
1.添加插件
先在Codex插件的里添加Computer Use和Record & Replay
Computer Use负责让Codex操作本地应用和浏览器界面。Record & Replay负责录制流程,并把流程整理成Skill。

2.在对话里开始录制
准备好要演示的流程后,在Codex里说:
@Record & Replay录制我下载周报数据的流程
录制开始后,你按平时的方式完成一次真实操作。
建议流程尽量短,不要混入无关动作。密码、验证码、密钥这类信息也不要录进去。
3.结束录制并生成Skill
操作完成后,关闭录制,Codex会读取事件流,然后生成Skill。
4.下次复用已有Skill
下次遇到同类任务,不需要重新录制。直接让Codex使用已有Skill。
使用示例:发票报销
在Codex App中输入以下提示词:
@Record & Replay发票报销流程录制

可以看到录制结束后Codex分析录制的操作过程,帮我生成了一个发票报销skill。
这个Skill是后续可复用的流程说明,通常会包含:
-
触发场景
-
所需输入
-
操作步骤
-
页面锚点
-
成功标准
-
异常处理规则
打开Codex生成的SKILL.md,可以看到详细的报销工作流,记录了每一步操作的过程。可以看到它记录的不是某个按钮的位置,而是要操作页面上的某个元素,读取什么页面元素的关键数据做判断。

下次使用时,我上传了一个新的发票,然后只需要说:
把这张发票给我报销了。
这时Codex就会按照Skill中的工作流做回放:打开页面,选择费用类型,上传发票,等待发票识别完成,然后自动提交系统,全程不需要人工参与。
这个生成的Skill是可编辑的,后续流程有变化,可以手动编辑或者直接让Codex更新Skill。
这个功能适合什么场景?
我会优先拿它录这几类流程:
-
内部系统操作:报销、工单、审批、后台录入
-
个人重复任务:下载报表、上传文件、整理固定格式材料
-
依赖登录态的网页流程:不方便调 API,但人工路径稳定
-
低频流程:不常做,但每次做都要重新想步骤
不太适合的场景:
-
页面变化太大,没有稳定按钮或文案
-
流程里有付款、删除、权限变更等高风险动作
-
需要大量主观判断
-
你自己还没跑通过正确流程
Record & Replay的功能边界
这个功能很适合桌面端的重复流程,但现在也有几个明显边界:
-
目前只能在 macOS 上使用。Windows 和移动端都还不能直接跑这套录制回放流程。
-
它依赖已有的登录态。像社保、摇号这类政府网站,每次登录都需要密码、短信或其他验证,必须先人工登录成功,Codex 才能继续执行后面的流程。
-
目前还不能在移动端使用。比如只存在于手机 App 里的流程,暂时不适合用 Record & Replay 处理。
-
操作桌面微信时不太稳定。微信本身有风控,自动化点击、发消息、上传文件都可能被拦截或表现不一致,不建议把强依赖微信的流程作为第一批录制对象。
所以更稳的用法是:优先录浏览器里路径稳定、登录态可保持、页面元素清楚的流程。
我的建议是:先录一个2到5分钟的小流程,不要一上来录复杂系统。
结尾
我最近会继续写一组使用Codex办公提效和Vibe Coding的实战教程。
如果你也在折腾Codex、AI Agent或个人自动化,可以点击关注一下。
参考:
更多推荐


所有评论(0)