阅读之前记得关注、星标⭐️,每天才能第一时间接收到更新。

我最近会持续写Codex、AI Agent和个人自动化系统,真实流程、提示词和踩坑记录。

6月18日,Codex App发布重磅功能Record & Replay。

翻译过来就是录制加复现。这个功能可以简单理解成:你在电脑上把一件事做一遍,Codex在旁边看,录完后把这套流程整理成一个可复用的skill。下次再做同类任务,你只需要告诉它这次的输入有什么变化,剩下的让它按skill执行。

这和普通录屏不一样。录屏只是把画面存下来,Record & Replay要做的是把操作过程转成Codex能复用的流程。

它能解决什么问题?

很多工作流都卡在一个尴尬的地方:写程序实现太费时,手动做又麻烦。

比如:

  • 下载后台报表

  • 创建固定格式工单

  • 把一个系统里的信息录入另一个系统

  • 每周按固定格式整理一次材料

这些事不难,但重复而繁琐。

它们也不太适合直接写死脚本。很多内部系统没有开放API,还依赖浏览器登录态、文件选择器、页面文案、动态识别结果和最终提交状态。

传统RPA(机器人流程自动化)可以录制操作,但通常更像“复刻点击”。页面稍微变一下,流程就不能用了。

Record & Replay的思路不一样。它会把一次演示整理成一份Agent能读懂的操作说明,而不只是记录鼠标轨迹。

这个功能的优势在哪?

它的优势主要有三点:

  • 理论上,它可以操作电脑上的任何软件。浏览器、桌面客户端、文件选择器都能纳入流程,前提是软件本身没有强风控。

  • 它不依赖传统RPA 工具,也不是按固定坐标复刻点击。按钮位置变了,只要页面元素、文案和上下文还清楚,流程就有机会继续跑。

  • Skill 是按用户真实操作流程生成的。你怎么做,它就按这个路径沉淀说明,比从零写Skill更快,也更贴近真实场景。

怎么使用?

整个流程分4步。

1.添加插件

先在Codex插件的里添加Computer Use和Record & Replay

Computer Use负责让Codex操作本地应用和浏览器界面。Record & Replay负责录制流程,并把流程整理成Skill。

2.在对话里开始录制

准备好要演示的流程后,在Codex里说:

@Record & Replay录制我下载周报数据的流程

录制开始后,你按平时的方式完成一次真实操作。

建议流程尽量短,不要混入无关动作。密码、验证码、密钥这类信息也不要录进去。

3.结束录制并生成Skill

操作完成后,关闭录制,Codex会读取事件流,然后生成Skill。

4.下次复用已有Skill

下次遇到同类任务,不需要重新录制。直接让Codex使用已有Skill。

使用示例:发票报销

在Codex App中输入以下提示词:

@Record & Replay发票报销流程录制

可以看到录制结束后Codex分析录制的操作过程,帮我生成了一个发票报销skill。

这个Skill是后续可复用的流程说明,通常会包含:

  • 触发场景

  • 所需输入

  • 操作步骤

  • 页面锚点

  • 成功标准

  • 异常处理规则

打开Codex生成的SKILL.md,可以看到详细的报销工作流,记录了每一步操作的过程。可以看到它记录的不是某个按钮的位置,而是要操作页面上的某个元素,读取什么页面元素的关键数据做判断。

下次使用时,我上传了一个新的发票,然后只需要说:

把这张发票给我报销了。

这时Codex就会按照Skill中的工作流做回放:打开页面,选择费用类型,上传发票,等待发票识别完成,然后自动提交系统,全程不需要人工参与。

这个生成的Skill是可编辑的,后续流程有变化,可以手动编辑或者直接让Codex更新Skill。

这个功能适合什么场景?

我会优先拿它录这几类流程:

  • 内部系统操作:报销、工单、审批、后台录入

  • 个人重复任务:下载报表、上传文件、整理固定格式材料

  • 依赖登录态的网页流程:不方便调 API,但人工路径稳定

  • 低频流程:不常做,但每次做都要重新想步骤

不太适合的场景:

  • 页面变化太大,没有稳定按钮或文案

  • 流程里有付款、删除、权限变更等高风险动作

  • 需要大量主观判断

  • 你自己还没跑通过正确流程

Record & Replay的功能边界

这个功能很适合桌面端的重复流程,但现在也有几个明显边界:

  • 目前只能在 macOS 上使用。Windows 和移动端都还不能直接跑这套录制回放流程。

  • 它依赖已有的登录态。像社保、摇号这类政府网站,每次登录都需要密码、短信或其他验证,必须先人工登录成功,Codex 才能继续执行后面的流程。

  • 目前还不能在移动端使用。比如只存在于手机 App 里的流程,暂时不适合用 Record & Replay 处理。

  • 操作桌面微信时不太稳定。微信本身有风控,自动化点击、发消息、上传文件都可能被拦截或表现不一致,不建议把强依赖微信的流程作为第一批录制对象。

所以更稳的用法是:优先录浏览器里路径稳定、登录态可保持、页面元素清楚的流程。

我的建议是:先录一个2到5分钟的小流程,不要一上来录复杂系统。

结尾

我最近会继续写一组使用Codex办公提效和Vibe Coding的实战教程。

如果你也在折腾Codex、AI Agent或个人自动化,可以点击关注一下。

参考:

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐