Codex 桌面版安装使用超详细教程：从零打造你的 AI 编程与自动化超级助手 2026 最新

《Codex AI助手使用指南》：本文详细介绍了OpenAI Codex的安装配置与功能应用。从官网下载安装后，用户可通过ChatGPT账户登录并获取API密钥。Codex支持多项目管理、代码生成与调试，具备沙箱权限控制、上下文记忆管理及模型选择功能。特色功能包括AI绘图、计划模式、Git集成、云端运行环境等。用户可通过AGENTS.md文件增强AI记忆，利用插件市场扩展能力，并通过Skills技

懿轩HQ

119人浏览 · 2026-05-14 08:00:00

懿轩HQ · 2026-05-14 08:00:00 发布

一、下载安装

官网：https://openai.com/zh-Hans-CN/codex/?utm_source=Ai138.com

官网会根据你的电脑版本给出下载 Windows 还是 MacOS 版，两者操作基本一致，唯一欠缺的功能是 Computer Use （自动化操作电脑的能力）。

接下来直接点击下载安装即可。

因为 Windows 上在官网下载完安装包，默认是通过微软商店安装，如果在桌面没有快捷方式，按照下述执行：

按下键盘上的 Win + R 键，打开“运行”对话框。
输入命令 shell:AppsFolder 并按回车，这会打开一个包含你电脑上所有应用的文件夹窗口。
在列表中找到 Codex 应用，鼠标右键点击它，选择“创建快捷方式”。
系统会弹出一个提示框，告诉你“无法在此位置创建快捷方式，是否将其放在桌面上？”，直接点击“是”即可。

二、基础使用

2.1 进入配置

安装完成后，点击使用 ChatGPT 登录。

现在ChatGPT的免费账户也能使用 Codex了，不过额度比较低。

对于国内用户按照下述登录方式登录：

国内用户可能会遇到登录后验证手机号的情况，可以直接官网登录不需要登录手机号：

https://platform.openai.com/login

首次用户登录会让你设生成你的 API 密钥：

保存好你的密钥，接着继续：

选择 I‘ll buy credits later 之后购买：

选择用其他方式登录：

用你刚才的 API 进行登录：

第一次进入软件要选一下希望 Codex为你处理的工作，Codex 会跟根据你的选择预装一些内置的插件和 Skills，当然进入软件以后，我们还可以按需安装这些插件，然后选择主要的使用场景是编程还是日常工作，这些都可以后续在设置里面进行修改。

选择好后，点击 Continue 进入应用。

职业类别	适用人群	推荐理由
Engineering (工程/研发)	软件工程师、后端/前端开发、全栈开发	Codex 会侧重于代码生成、调试、系统架构设计、API 文档编写以及技术债务清理。
Data Science (数据科学)	数据分析师、数据科学家、机器学习工程师	AI 会更擅长处理 Python (Pandas/NumPy)、SQL 查询、数据可视化建议以及模型训练脚本的辅助。
Product (产品)	产品经理、技术负责人	AI 可能会协助将需求转化为技术规格说明书，适合涉及写需求文档和技术对接的工作。
Marketing (市场营销)	市场专员、内容运营、SEO 专家	Codex 会侧重于文案生成、活动策划、竞品分析框架以及社交媒体内容的优化。
Sales (销售)	销售代表、业务拓展	侧重于邮件撰写（冷启动邮件）、客户话术整理、CRM 数据录入建议以及销售漏斗分析。
Operations (运营)	运营经理、项目管理	侧重于流程优化、SOP（标准作业程序）编写、资源协调以及会议纪要整理。
Finance (财务/金融)	会计、金融分析师	侧重于财务报表分析、Excel 公式生成、风险评估以及合规性检查。
Design (设计)	UI/UX 设计师、平面设计师	让模型更懂设计系统的描述，或辅助生成前端样式代码。
Student (学生)	在校大学生、研究生	回答更注重解释性和教育性，适合学习新概念、辅导作业或规划学习路径。
Something else (其他)	自由职业者、行政人员或工作内容综合者	适合不想被特定标签限制，或工作跨越多个领域的用户，是最安全的选择。

可以直接关闭弹窗或者选择选择尝试使用 GPT-5.5 now：

接下来点击设置沙盒按钮，完成沙盒的初始化。

我们点击右上角的按钮显示侧边栏。我们看到 Codex APP是非常经典的三栏布局，左侧是任务列表，中间是对话窗口，右侧是多功能区域。

2.2 任务管理

2.2.1 项目创建

我们先创建两个项目文件夹来展示一下它的基础使用。这里我新建了两个文件夹，作为两个项目文件夹。

第一个文件夹名称：creative-portfolio 创意作品集
第二个文件夹名称：smart-dashboard 智能仪表盘

“接下来我们来到 Codex，点击‘进入项目工作’并选择‘使用现有文件夹’。我们先选择第一个文件夹，creative-portfolio 创意作品集。

在这里，我输入指令让 Codex ：

帮我设计一个 HTML 单页面极简风格的个人摄影师作品集首页，要求采用全屏瀑布流布局，并包含深色模式的切换功能

点击回车后，你会看到左侧边栏自动增加了一个以文件夹命名的项目，里面展示了正在运行的构建任务。

接下来，我们点击左上角的‘新对话’按钮（Windows 快捷键 Ctrl+N，Mac 快捷键 Command+N）来开启一个新的对话。在弹出的选项中，我们选择‘添加新项目’，然后选中桌面上的第二个文件夹，smart-dashboard 智能仪表盘。

在这个新项目中，我输入第二个需求：

利用 React 框架开发一个实时的加密货币价格监控看板，需要包含搜索功能以及模拟的数据刷新动画

然后回车开始执行。

现在，你可以看到 Codex 正在同时处理两个截然不同的任务：一个是在构建视觉导向的静态页面，另一个则是在处理带有逻辑交互的动态应用，这完美展示了 Codex 多项目并行工作的强大能力。

在两个项目并行工作的同时，我们还可以开启更多的工作对话。比如这里我想询问 Codex一个技术问题，我们把鼠标指向第二个项目，点击这个小按钮，在项目里面开启新的对话。这里我询问Codex React框架是什么？

有一个任务上面显示一个绿色标签，表示等待批准。我们来到这个等待批准的任务里面，发现Codex 需要联网下载 React 项目的模板正在申请权限，我们点击是批准这个任务就继续执行了。

任务上面标记的蓝色的小圆点，表示任务执行完毕。

2.2.2 项目展示

creative-portfolio 创意作品集

smart-dashboard 智能仪表盘

2.3 左侧边栏

Codex任务列表非常的简洁、美观、好用，可以很方便的观察任务状态，可以并行开启多个工作任务，还能高效的从多个任务里面自由的切换。

我们再来看一下左侧边栏任务列表的其他功能，新对话按钮用来开启新的对话，在下面可以选择对应的项目，也可以选择不使用任何的项目，纯粹的闲聊。

这种不属于任何项目的对话都会被收录到任务列表的最下面，也就是对话这一栏里面。

左侧边栏第二个按钮搜索，Windows 快捷键是 Ctrl + G，Mac 电脑的快捷键键是 Command + G，可以搜索近期的对话历史。

不过我试了一下这个功能只能搜索到对话的标题，它无法搜索到对话里面的内容。这里补充一下，每个对话标题都是AI根据对话内容自动摘要生成的。我们也可以选择某个对话，双击对它进行一个重命名。

如果我们不再需要某个对话了，可以点击这个归档对话的小按钮确认，然后我们的对话就在左侧边栏消失了。

在设置已归档对话里面可以找到我们删除的对话。

点击取消归档就可以把它还原回来。

左侧边栏还有两个按钮，插件与自动化，这个到后面章节再来看。

2.4 中间对话

2.4.1 权限访问管理

接下来我们来看一下中间的对话页面，这里最显眼的功能就是权限控制。

Codex 的权限控制全部是围绕沙箱来展开的，这点跟 Claude Code 有本质上的不同。Claude Code 的沙箱功能需要手动开启，它沙箱更像是一层可以额外开启的保护，而 Codex 的沙箱它是整个权限系统运行的地基。

Codex 会把当前的项目文件夹作为一个的沙箱进行管理。

在默认权限下面，Codex 具有读取修改沙箱内所有文件的权限。在默认模式下，Codex APP 可以直接修改沙箱内，也就是项目文件夹的所有文件。它并不会一个个的跑来问你我觉得这点非常的方便，也是符合正常的使用习惯的。

当然我们也可以通过设置改成逐个文件修改，都需要审批。这个在后半段高级设置这个章节我们再来讲述。

Codex 沙箱有两个默认限制，

第一点是 Codex 不能修改沙箱外的文件。
第二点是 Codex 的沙箱是禁止联网的。

这两点硬性限制，它并不是靠模型自觉遵守，而是 Codex 使用操作系统底层功能实现的。

不同操作系统的实现机，这是不一样的。比如 MacOS 使用的是系统内置的 Seatbelt Sandbox 机制，Codex沙箱功能是前阵爆火的 Harness Engineering 概念的一个典型的工程。

实现他用操作系统级别的机制，把AI的能力约束在一个可控的范围之内。这也很形象的体现了这个词的原始含义，也就是马具。

AI 就像一匹能力很强的马，而沙箱权限审批机制这些就是套在他身上的马具。如果 Codex 需要修改沙箱外文件或者需要联网，可以向用户申请权限，这个操作叫做 escalate，也就是提权操作。在默认情况下，提取操作都是需要人工审核同意的。

Codex 为我们提供了第二个档位，也就是自动审查。启动了自动审查以后，Codex 会自动调用，用一个小模型对提权操作进行安全性审查。如果发现是低风险的操作就会直接放行，只有高风险的操作才会触发人工审查，这也是我最推荐的模式。自动审查使得绝大部分操作不需要人工审批，在获取了较高安全性的同时，还极大提升了使用的便利度。

所以一般情况下，在权限管理这里我都推荐开启第二档，也就是自动审查 Codex，还有第三档完全访问权限。开启了这个以后，Codex 完全无视沙箱的限制，可以在电脑上执行一切的操作。不过我们尝试开启的时候，这里出现了很醒目的风险提示，提示我们要谨慎使用。

2.4.2 上下文使用情况

在权限控制的右边有一个圆圈，展示的是当前上下文使用情况，这里翻译的不太好，准确的翻译应该上下文使用量。

它的主要作用是让你知道AI 还能“记住”多少东西。

监控记忆容量：当你和一个项目聊了很久，或者上传了很多代码文件后，这个数字会不断上涨。
防止“失忆”：如果圆圈满了（100%），AI 就必须“擦掉”最早的内容才能写下新的内容。这意味着它可能会忘记你刚开始给它设定的规则或写过的代码。

这个圆圈就是一个“内存条”指示灯。只要它没满，你就可以放心地继续和 AI 对话；如果它快满了，就意味着 AI 可能会开始遗忘早期的对话细节。

同时信息显示的是这个对话里的历史，对话内容占用了多少模型上下文空间。当上下文超过限制的时候，Codex 会自动对对话历史进行压缩，从而释放出更多的上下文空间。

我们也可以输入斜杠，选择压缩选项，手动触发一次上下文压缩。压缩完成以后，Codex 会把之前对话的一些不重要的内容排除掉，可以有效提高AI的专注力，并且降低 Token 消耗。

不过在 AI Agent 领域 有一个通用经验是清空好于压缩，因为过多的历史会话会干扰AI的注意力。当我们让AI执行完一个任务以后，最好是开一个新的对话，清空上下文，这样有助于AI把注意力全部集中到新的任务上面来，从而提高任务的执行效果。

2.4.3 模型选择控制

在上下文窗口的右边是模型选择，可以根据任务的复杂程度选择模型的思考强度。

下面可以切换模型，这里一般我们就选择最新的模型，比如现在是 ChatGPT 5.5，下面还有一个速度选项可以选择标准。在快速模式下会提升50%的AI推理速度，但是快速模式会消耗两倍的套餐用量。如果你的任务很急，但是套餐的余量还有很多，可以选择开启。

说到套餐余量，我们可以在左下角的设置剩余额度里面找到你现在的套餐余量。

这里有两个限额，分别是5小时限额，还有周限额。这两个限额任意一个到达上限codex都不能继续使用了。两个限额都有对应的重置时间，时间到了以后都会重置成100%。

右边还有一个语音输入功能，可以让我们跟AI的交互从打字变成口喷，非常的好玩。

2.4.4 AI 画图功能

Codex内置了AI画图功能，而且它使用的是当今最强的AI生图模型 GPT-Image-2。

这是刚才我让 Codex 为我的‘创意作品集’生成的初始页面。我们看到它已经自动填充了一些图片，但我检查后发现，这些图片大多是比较生硬的通用素材，有两个地方非常不合适：

首先是‘作品展示区’，它现在用的是一些普通的风景照，完全没有体现出我想要的‘极简主义黑白人像摄影’的那种艺术质感和光影层次。

其次是‘关于摄影师’板块，这里原本用来展示我工作室外观或拍摄花絮的地方，生成的图片非常模糊且缺乏真实感，看起来就像是一个假的摄影棚。

针对这两个视觉上的痛点，我们直接让 Codex 利用它的生图能力来重新生成并替换这些图片。

我们来到 Codex，新开一个对话，项目选择刚才创建的‘创意作品集’。

首先，我让 Codex 调用 AI 绘图功能，为我的网站生成三张‘极简黑白风格的人像摄影作品’，用于首页的轮播展示。

中文提示词

“为我的摄影作品集网站生成三张轮播图。
风格要求是极简主义的黑白人像摄影，光影对比强烈，画面干净，
分别展示面部特写、全身剪影和半身侧脸。”

稍后我们看到 Codex 为我们生成了三张图片，风格保持了高度统一，网页上也成功替换成了轮播图，效果很不错。

在 Codex 执行过程中，我随时跟踪进度。这里我发现了一个问题——它生成的图是用 SVG 矢量线条画的，线条生硬，完全没有我想要的‘复古暗房’那种质感。

我原本是想让它调用内置的 AI 生图模型来画一张逼真的风格图。借着这个机会，我要介绍 Codex 的一个强大功能，它的英文名叫做 Steer，中文翻译为‘引导’。这个词的原意是‘打方向盘’。

当我们发现 AI 在执行过程中理解错了方向，就不应该让它继续错下去，而应该及时接管方向盘，进行人工干预。

这里我截了一张刚才生成的 SVG 图发送给 Codex，并告诉它：‘这图不行，太简陋了，应该调用 AI 绘图能力生成一张图片。’

在默认模式下，这个新的指令会进入指令队列排队，需要等 AI 把上一轮任务全部执行完才能处理新指令。但我们现在急需纠正它，所以直接点击输入框旁边的‘引导’按钮（英文版叫 Steer），或者使用快捷键 Ctrl+Enter（Mac 是 Command+Enter）。

我们看到 Codex 立即响应，显示‘已引导对话’，并回复说‘味儿不对，明白了’，随即中断了原本的代码编写，转而调用 AI 生图模型重新生成。

我们成功使用 Codex 的 Steer 功能，在运行中途纠正了模型的运行方向。在 Codex 的设置 > 常规设置里，有一个‘跟进行为’选项，这里可以设置指令是‘排队’还是‘直接引导’。我推荐保持默认的‘排队’，这样比较安全；只有在需要紧急纠错时，我们再点击‘引导’按钮。

稍后，我们看到 Codex 为我们重新生成了一张非常有质感的复古风格地图，并且完美替换到了网页里，效果非常棒。

2.4.5 计划模式

在对话窗口的加号菜单里，里面有两个功能。首先是添加照片和文件，我们可以用照片或者文件给AI补充上下文信息，或者可以像刚才一样，通过复制粘贴直接把照片或者文件粘贴进对话窗口。

还有一个非常重要的功能叫‘计划模式’。开启它之后，Codex 就不会立即动手干活，而是先输出一份完整的工作计划与我们确认。对于所有复杂的重构任务，建议都先开启计划模式，确保你跟 AI 的‘颗粒度’是对齐的。

我们在 Codex 里打开计划模式，输入需求：‘把这个项目改造成 Next.js 框架’。

在计划模式中，Codex 倾向于使用‘问题卡片’的形式与我们沟通。

它询问我希望使用哪种项目形态？我选择 App Router + TypeScript。

它询问作品集里的图片资源，迁移时你希望怎么处理？我选择 先保持现状。

Codex 随即生成了一份完整的迁移计划。我仔细阅读了一遍，确认无误后，点击‘是，实施此计划’。

代码编写完成后，Codex 启动了它内置的浏览器进行自动化测试。在右侧的多功能窗口，Codex 自动打开了浏览器，我们可以点击‘展开面板’按钮，查看项目的完整运行状态。

我们看到这次架构迁移非常成功，页面上的所有摄影作品元素都完整保留了，非常棒。

最后，如果对某个细节不满意，我们可以点击工具栏上的‘注释’按钮（看起来像个气泡），然后直接在浏览器预览中选中那个元素或者右键这个元素选择注释。

比如这里，我说：‘为什么这个这个按钮颜色是浅灰色的？把它改为深灰色’然后点击发送。

在下方的对话中，我们可以实时看到它的修改过程。刷新页面后，这个星星就变成了实心。这样，我们就通过计划模式配合 Codex 的内置浏览器和注释功能，成功完成了项目的架构迁移与细节优化。”

三、编辑代码

Codex APP并不是传统的 DE，它并不提供完整的代码编辑功能。我们可以在右上角点击切换文件数，这里虽然可以查看代码，但是没法直接编辑。我们只能点击某行代码来写批注，并不能直接修改代码。我们可以借助第三方的IDE来修改代码。

3.1 初始化 Git 本地仓库

在进行代码管理之前，我们需要先把项目初始化成一个 Git 工程。

什么是 Git？

Git 就像是代码世界的“时光机”与“存档点”。它不仅能帮你自动记录每一次修改的轨迹，让你随时穿越回任何一个历史版本（哪怕是一周前的代码），还能让你大胆尝试新功能——因为无论怎么改，只要一键“读档”，就能瞬间恢复到修改前的完美状态。

后悔药：代码写崩了？一键回退。
团队协作：你和你的搭档可以同时修改同一个网站，Git 会帮你们把修改合并在一起，而不是互相覆盖。
云备份：通常我们会把 Git 仓库同步到 GitHub 或 GitLab 上，这样就算你电脑坏了，代码还在云端，换台电脑随时接着写。

如何下载 GIt 借鉴我的这两篇文章：

这里我们先开启一个对话，输入提示词：

把项目初始化化成一个 git 工程，注意排除掉不需要的文件。

Codex 先为我们创建了.gitignore 文件，把一些不需要提交的内容排除出去。

Codex 帮我们把项目初始化成了 Git 仓库。初始化成 Git 仓库以后，打开右边侧边栏，右键代码区域就可以选择在哪个 IDE 去编辑你的代码。

这里有 VS Code （默认打开）按钮，我们点击一下，我们就可以快捷的使用VS Code来查看和修改代码。同时也支持用其他 IDE，如果你的电脑上装过这些IDE，就可以在这里关联出来。例如：Cursor、IDEA等。

可以在设置里面设置你默认打开的 IDE：

这里我在VS Code打开：

3.2 提交代码到远程仓库

如果说你电脑上的 Git 仓库是“本地存档”，那么远程仓库就是把这份存档上传到了互联网上的服务器（云端）。

它的作用就像 GitHub、Gitee 或 GitCode 这样的平台：

备份与防丢：万一你的电脑坏了、丢了，或者代码被误删了，云端的代码依然安然无恙，随时可以下载回来。
团队协作：它是团队的“中央枢纽”。大家把代码都推送到这里，也能从这里拉取别人的最新代码，避免“我发你一份，你发我一份”的混乱。
展示作品：对于你正在做的“创意作品集”，远程仓库就是你最好的在线简历。面试官或客户可以通过它查看你的代码质量和开发历史。

常见的远程仓库平台

GitHub：全球最大的代码托管平台，程序员的“朋友圈”，资源最丰富。
Gitee（码云）：国内的托管平台，访问速度快，全中文界面，对国内用户非常友好。
GitCode：CSDN 旗下的代码托管平台，集成了很多国内开发者的资源。

为了方便国内用户，我这里以Gitee为例，要求AI把代码帮我提交到 Gitee 上面。

打开 Gitee官网：https://gitee.com/

直接用你的手机号注册登录即可，登录成功后，点击右上角加号，新建仓库即可。

开源 / 私有（权限设置）决定谁可以看到你的代码。

开源（所有人可见）：公开项目，任何人都能浏览、克隆（下载）代码，适合展示作品或参与开源社区。
私有（仅仓库成员可见）：私密项目，只有你和你邀请的协作者才能访问，适合个人练习或商业项目

我这里直接默认设置，点击创建：

接着复制这条指令给 Codex，输入指令，让其推送代码：

帮我推送当前项目到 https://gitee.com/yixuan-space/creative-portfolio.git 这个仓库中。

以前没有用过 Gitee 仓库的，推送过程中可能弹窗需要你登录一下你的 Gitee，输入你的Gitee账号密码正常登录即可。

我们点击我们的远程仓库地址就可以发现我们的代码已经推送成功了：

我们可以使用对话的方式进行一切 Git 与 Gitee 操作，这都属于编程的基础知识，这里我就不展开讲了。

接下来我主要讲两个进阶技巧：

第一个是使用 Git 对开发过程进行回滚；
第二个技巧是 Git Worktree。

3.3 Git 回滚操作

我们先看第一个技巧：回滚。这里我新开一个对话。

我们打开侧边栏，点击加号打开浏览器，输入我们照片项目本地开发的地址。

现在进入浏览器预览，我们在这里模拟一些修改需求。我让 Codex 在这里添加一个“图片拍摄日期”的功能，直接点击 Ctrl + Enter 发送。Codex 很快为我们添加了“拍摄日期”这个显示字段。

如图所示就实现了悬停显示日期的效果：

当 AI 完成一个功能的开发以后，我们就使用 Git 把它备份保存一下。

这里输入请提交这些更改，消息为：添加拍摄日期显示功能，点击继续。
也可以在右边状态栏点击Git图标选择提交。

上述两种方式都可以，这样最新的代码改动就以 Git 的方式安全保存下来了。

接下来，我让 AI 把“拍摄日期”移动到作品标题的上方。Codex 很快完成了修改。我们还是从内置的浏览器看一下效果，发现日期确实跑到了最上面。

不过这么一改，我觉得排版没有原来的好看。我后悔了，我觉得还是把它放回原来的位置比较好。这里我想做的是把这一次的对话，包括这一次的代码改动全部回滚掉，最好是当做无事发生。

这里我们先借助 Codex 的分叉功能。我们找到上一次对话结尾的位置，点击这个分叉按钮，选择“派生到本地”。

我们看到 Codex 的分叉功能就是在我点击的这个位置把对话复制了一份。这样复制出来的新对话就已经剔除掉了我们刚才想删除的部分了。

不过，分叉功能只能回退对话历史，它不能同步回退代码。所以这里我们要做的是把代码一同回退掉。

我们可以在 VS Code 里面点击这个 Source Control 按钮，查看所有的 Git 提交记录。这里我需要把代码回退到“添加拍摄日期”的那个状态上。我们点击右键，选择“复制提交哈希”，这样我们就把这次提交的 ID 复制下来了。

我们回到 Codex，先让 AI 把代码回退到这个状态，后面粘贴我们刚才复制的提交 ID。

你先把代码回退到当前状态：756555064969672054e69588ae1dc0305630e2e7

我们看到代码回退成功了，在浏览器里可以看到“拍摄日期”又变回了原来的位置。这样我们就使用了 Codex 对话分叉功能加上 Git 操作，成功地把这一次不需要的改动从代码层面和对话历史层面进行了完全的回滚。

3.4 Git Worktree 功能

接下来我们来看下一个功能，就是 Git Worktree。Worktree 这个名字听起来比较唬人，其实它本质上就是用 Git 创建一个新的分支，然后把这个新分支的代码完整地复制到一个新的文件夹里面。这个新文件夹就是一个 Worktree。主文件夹和分支文件夹可以并行工作，我们可以在两个文件夹里面各自修改代码，互不干扰。

我们可以基于主干创建多个分支，它们在底层通过 Git 关联在一起，分支文件夹的改动随时都能轻松合并回主干。

找到我们的项目，右键选择创建永久工作室。这里起个名字，我想让第一个工作室专注优化“作品详情弹窗”这个部分，我给它加个后缀叫 -popup-detail。

我们看到 Codex 把整个项目复制到了一个单独的文件夹里面，它跟主干已经不是同一个文件夹了。

这里我们再建一个工作室，第二个工作室主要用来负责优化首页的相册网格布局，我们给第二个工作室也起个名字，后缀就叫 -photo-grid。这样我们就拥有了两个 Worktree 分支，它们都位于不同的文件夹下面，所以它们之间的并行工作不会影响到主干。

这里我们来测试一下。我们先打开第一个分支，新对话，输入需求：“优化一下作品详情弹窗，增加图片放大预览功能”，开始。

然后我们来到第二个分支，创建一个新的对话，输入需求：“优化首页相册网格，让图片在移动端变成单列展示”，开始。

如图所示两者已经成功了：

优化一下作品详情弹窗

优化首页相册网格

我们在两个分支上面进行并行开发，因为它们位于两个不同的文件夹，所以互相之间不会产生干扰。两个分支在各自的文件夹里面都开发完毕了，接下来我们可以把它合并回主干。这里直接输入“合并回主干”，两个分支都做一样的操作。

好，我们看到两个分支都成功合并进了主干。我们在浏览器这边可以看到，作品弹窗已经支持放大了，首页的布局在移动端也变成了单列。这样我们使用 Git Worktree 功能高效并行开发了两个任务。当我们的分支使用完毕，我们可以直接右键移除，把两个临时的分支移除掉，然后回到主干继续工作。

3.5 Codex 云端运行环境

接下来我们来介绍 Codex 的云端运行环境。Codex 的任务除了能在本地，也就是这台电脑上运行，它也可以在云端运行，比如处理文件或者修改代码等等。

启动云端运行环境的前提是要先把代码全部同步到 GitHub 上面。我们在 Github 上创建一个仓库。

紧接着将代码推送到上面。这样我们所有的代码都同步到了 GitHub 上面，确保了 GitHub 上面的远端代码跟本地代码是完全一致的。

接下来我们在运行模式这里选择“关联 Codex Web”，也就是把这个项目先初始化成一个网页版可以用的项目。

点击连接 Github，登录你的Github账号。

接下来我们选择代码仓库，这里输入项目的名字，然后直接在这里输入我们的需求就可以了。

比如我想让 Codex 给图片加载设置一个默认效果。我让 AI 给所有的作品图片添加一个淡入淡出的加载动画，开始。在下面可以看到正在执行的任务。

我们看到 Codex 先是初始化了一个云端运行环境，然后把 GitHub 的代码下载进去了。接着它调用 AI 功能对整个项目进行分析，然后完成了修改。

我们可以点击右上角的按钮创建拉取请求，然后再点击查看 PR。

刚才的代码改动就以一个 Pull Request 的形式提交到了 GitHub 的网站上面。我们可以在这里对它修改的代码进行审核。确认了没问题以后，在下面点击这个合并按钮，把代码合并进主干分支，这样修改就完成了。

在 Codex APP 里面也能直接看到你刚才的远程对话：

我们回到电脑上的本地项目，点击“使用 VS Code 打开”，点击 Source Control，这里有一个 Sync Changes 同步更改，点击一下。它的意思是把 GitHub 上面的最新代码同步到本地。

也可以通过本地刚才显示的远程对话这里选择应用，也可以更新项目：

然后我们在本地再测试一下，看到这里的图片加载时已经有淡入淡出的动画效果了。

这样我们就使用了 Codex 的云端运行环境，完成了一个任务，并且把代码同步到了本地。

Codex 网页版是可以用手机打开的，我觉得它最适合的工作场景就是比如我们出门在外面手头没有电脑，让它使用云端运行环境完成工作，我们只需要在手机上进行审批就可以了。每当我们开启一个新对话，就进入了一个全新的上下文。

AI完全不记得之前发生了什么，进行过什么样的对话，甚至对于整个项目的记忆都是空白的当项目变得复杂以后，每次对话都要重新给A交代一遍项目背景，或者让他自己读代码，自己摸索，这是一种非常低效的工作方式。

四、Codex 增加记忆系统

接下来我们主要介绍两种给 Codex 增加记忆系统的方式。

4.1 项目级上下文配置

我们先看第一个通用方法，通用方法就是在项目的根目录创建一个 AGENTS.md 文件。这个文件在 Cursor、Cline 等等其他的 AI Agent 工具里面也是通用的。

这里我们用 VS Code 打开项目，我们来到项目根目录，右键新建一个叫做 AGENTS.md 的文件。

这个文件就是 AI 每次对话的时候必读的一个指南。有了这个文件以后，后续我们跟 Codex 的所有对话都会带上这个文件的内容作为上下文。这个文件有助于帮助 AI 更快地理解项目。

比如这里我给 AI 补充一点上下文：我叫“懿轩”，擅长 Python 和 JS，对 CSS 一窍不通，遇到网页样式的问题需要用大白话给我解释。

我们回到 Codex 新开一个对话，这里我询问 Codex 我叫什么，擅长什么技术。我们看到 Codex 可以自动读取 AGENTS.md 文件，然后把里面的内容自动作为上下文带入对话。

如果自己编写这个 AGENTS.md 也有点麻烦，我们可以让 Codex 来帮我们编写。我让 Codex 通读当前文件夹，把它学到的关于项目的知识保存到 AGENTS.md 文件里面。Codex 为我们完成了 AGENTS.md 文件的编写，且把关于项目的重要知识都写入了这个文件。后续当我们开启新对话的时候，Codex 就会自动获取这些知识，可以帮助它更快速地上手项目。所以对于复杂项目来说，这个 AGENTS.md 是必需要写的。我们把 AGENTS.md 放到项目的根目录，它只对当前这个项目生效。

4.2 全局配置与记忆功能

Codex 为我们提供了另外一种方式，可以编写全局的 AGENTS.md，可以对这台电脑上所有的项目生效。我们回到 Codex 左下角设置，在“个性化”这里找到“自定义指令”，这里编辑的就是全局的 AGENTS.md，也就是对所有项目都生效。

最近看到一些朋友们说 Codex 有时候执行命令失误，把自己的整个文件夹都删除了。所以我一般会加上这么一个全局的提示词：“禁止使用脚本批量删除文件或目录，只能使用 rm（或 remove item）一个文件一个文件地进行删除。如果必须批量删除，应该停止操作，让用户手动删除。”

这些内容保存进了 Codex 全局的 AGENTS.md 文件里面。我们可以来到 C 盘 用户\你的用户名\.codex 这个文件夹，里面有一个 AGENTS.md 文件，这里面就是我们刚才填写的对所有项目生效的全局提示词。

Codex 记忆功能还有一个实验性的特性，就是在下面有一个“启用记忆”。开启以后，它可以从聊天里面生成新的记忆，并且把它带入新的聊天。因为这个功能目前还是实验性的，这里我就不多做介绍了。

五、插件与自动化

我们在 Codex 左侧边栏点击“插件”，进入了 Codex 官方插件市场。我们看到这里有两类，一个是“插件”，一个是“技能”。插件一般是第三方服务为 Codex 编写的软件包，这些第三方软件把自己的能力用插件的形式注入 Codex，我们看到能力已经非常全面了。然后“技能”这一栏就是 Agent Skills。

有关 Skills 可以看这几篇文章：

Skills-manage：一站式管理所有 Skill，统一展示 Claude、Cursor、Gemini 等20+ AI编程工具的技能库-CSDN博客

构建 AI Agent 必备：Skills 的定义、内部结构及开源资源汇总_skill平台导航-CSDN博客

这里还是看插件，这里我们安装两个插件来测试一下。首先第一个是 GitHub 插件。

然后我们再来一个 Gmail 插件，让 Codex 可以控制我的谷歌邮箱。它自动在浏览器弹出了谷歌的登录窗口，我们先登录一下，这里显示 Gmail 已连接就配置成功了。

然后我们先开启一个对话，输入斜杠 / 调用起我们的插件。先选择 GitHub，查询一下我 Star 数量前十的开源项目以及 Star 数；同理我们再唤起第二个插件 Gmail，用我的账户发邮件给我自己做一个摘要。

开始，好，任务处理完成了，邮件也已经发送了。我们去 Gmail 邮箱看一下，在 Gmail 邮箱里面就可以看到这封自己发给自己的邮件，里面对我 Star 数量前十的项目做了一个摘要，非常不错。

接下来我想每周都运行一下这些任务，来观察一下我这些仓库的 Star 数量有没有上涨。我跟 Codex 说：“很好，你把上述工作做成一个自动化，然后每周五下午四点都发邮件给我。”

开始，好，这个自动化工作流就创建了。我们可以在左侧边栏找到“自动化”，这里有一个数字“1”，点进去就可以看到我们的自动化工作流了。点击这个小铅笔，还可以进行编辑。比如可以编辑它重复执行的时间是每周、每天还是每小时，编辑它使用的模型。一般这种简单的自动化任务，我们选择这种 Mini 模型就可以了。

还可以点击这个“立即运行”按钮再测试一下。

Codex 还有一点非常好，它在执行过程中如果积累了经验，它会把它的经验写成这么一个 MEMORY.md 的文件，用来帮助下一次自动化执行。这个功能非常不错，很好用。

这个自动化功能配合浏览器自动化，还有 Computer Use，玩法就更多了。我们在右上角点击“新建自动化”，比如我可以让他用 macOS 的 Computer Use，把今天 Teams 上的今日聊天记录汇总成工作日报发给老板；或者让他用内置浏览器打开哪个网站，然后点击签到按钮签到。这些都可以发挥自己的想象力，打造各种好玩的玩法。

六、Skills 技能包

Skills 是给 AI Agent 的一个专业技能包，或者说是一种带目录的说明书。我们可以把工作流、专业能力或者某些规范封装定制成一个个 Skills 交给 AI Agent，让 Agent 在执行特定任务的时候更稳定、更高效，输出也更可靠。

6.1 官方 Skills

这里我们介绍三种给 Codex 安装 Skills 的方法，分别是官方 Skills、第三方 Skills，还有自己编写 Skills。

在 Codex 的插件跟技能里面都可以找到官方的技能。这里分类有点怪，因为有的插件本身它就是一个技能。比如我们来看这个 Remotion，Remotion 是一个让 AI 用编程的方式来创建动画视频的工具。我们看到这里面只包含一个 remotion-best-practice 技能，它也没有任何的安装包，但是它还是归到插件里面的。

我们先把 Remotion 安装一下。

我又新建了一个 remotion-project 项目文件夹，然后我们在 Codex 添加新项目，选择这个新文件夹。使用斜杠 / 唤起我们刚才安装的 Skill，这里输入提示词：“帮我生成一个 3D 圆锥摆的视频动画，需要有受力分析，角速度随时间缓慢增大。”

开始，Codex 调用了 Remotion 技能，它学习到了如何使用 Remotion 来创建这种视频。任务完成，Codex 为我们交付了一个完整视频，开启了一个网页版的剪辑工具。我们先看看视频，这是一个 3D 圆锥摆的动画演示。我们再看一下这个网页，一个网页版的 Remotion 剪辑器。好，这样我们就调用了 Remotion 官方技能，为我们生成了完整视频。

conical-pendulum

6.2 第三方 Skills

接下来我们看一个第三方 Skills 的案例。这是我在 GitHub 上面找的一个开发电子杂志封面、网页 PPT 的 Skill。

地址：https://github.com/op7418/guizang-ppt-skill

AI 调用这个 Skill 可以设计出这种风格的网页版 PPT，可以把它用在线下分享、行业内部讲话、个人风格的演讲等等。

我们来测试一下。首先第一步把这个 Skill 下载一下，在 Code 这里点击 Download ZIP。

然后我们打开压缩包，压缩包里面有这么一个文件，我先把它解压出来。

我又新创建了一个叫做 PPT 的文件夹，进来以后我们创建一个名字叫做 .codex 的子文件夹。在这个子文件夹里面我们再新建一个叫做 skills 的子文件夹，然后把我们从 GitHub 上面下载的 Skills 直接放到这个 skills 的子文件夹里面。

我们回到 Codex 添加新项目，找到我们的 PPT 项目。我们直接斜杠 / 找到这个 PPT Skill，然后输入我们的需求：“根据以下材料生成 PPT。Codex 是一款功能非常强大的 AI 编程与自动化助手（类似于 Cursor、Cline 等工具）。它不仅能够帮你写代码、改 Bug，还能通过插件、技能包（Skills）和自动化工作流，极大地提升你的开发效率。”

开始，Codex 完成了任务。我们打开看一眼 PPT 效果，非常不错，详略得当，重点突出，还加了很多高级的动效。

6.3 自己编写 Skills

接下来我们来看第三种使用 Skills 的方法，也就是自己创建 Skill。这里我以 “会议录音转待办清单（Action Items）”的 Skill 为例。

我新建了一个项目文件夹 meeting-skill。

然后我来到 Codex 添加新项目，选择新建的项目文件夹。我们输入斜杠 /，然后找到 Codex 的内置技能 Skill Creator，一个帮助我们创建技能的技能。接下来输入提示词创建一个 Skill。

这里介绍输入一个技巧：当我们输入一行命令的时候，如果想换行，我们不能点回车，点回车就直接发送了。换行我们要使用 Shift + Enter。

请帮我创建一个名为“会议待办提取器”的 Skill。
工作流程要求：
读取我提供的会议录音转录文本或原始笔记。
分析文本，找出其中提到的所有“待办事项”、“后续行动”或“需要跟进的任务”。
忽略闲聊和已经完成的讨论，只聚焦于未来的行动。
输出一个 Markdown 格式的表格，表格必须包含三列：【负责人】、【具体任务】、【截止日期】（如果原文没提，就填“待定”）。
在表格下方，用简短的几句话总结一下本次会议的核心议题。

好，我们开始。Codex 说他会使用 Skill Creator 把这套流程固化成可复用的 Skill，这正是我想要的。我们注意到这里有一个很有意思的点，他在清理测试文件，但是每次它只删一个。因为之前的章节我介绍记忆系统的时候，在这里增加了全局提示词，要求它只能使用 rm 一个文件删除，不能批量删除文件。我们看到 Codex 严格遵守了我的约定，表现得非常好。

任务完成了，它交付了一个 skill.md 文件。

创建好后，你可以新开一个对话，输入 / 找到你刚才做的“会议待办提取器”。

然后随便找一段模拟的会议记录丢进去，比如：

“大家辛苦了，刚才我们讨论了双十一的活动页面。小王，你记得在周五前把首页的 Banner 图换掉，要用红色的那个版本。还有小李，你跟进一下支付接口的问题，最好明天下班前给我个反馈。对了，老张，你下周要把服务器的扩容方案做出来。咱们这次主要就是把活动页面和支付稳定性搞定。”

Codex 会调用你的 Skill，迅速给你吐出一个非常清爽的结果：

会议核心总结：
本次会议主要讨论了双十一活动页面的视觉更新以及支付接口的稳定性问题，并明确了服务器扩容的后续计划。

待办事项清单：

负责人	具体任务	截止日期
小王	将首页 Banner 图更换为红色版本	本周五前
小李	跟进支付接口问题并反馈	明天下班前
老张	制定服务器扩容方案	下周

七、MCP 模型上下文协议

除了使用插件和 Skills，还有一个扩展 Codex 能力的方法就是 MCP。MCP 全称是模型上下文协议。简单来说，MCP 就是 AI 大模型的标准化工具箱，大模型可以利用这些工具与外界互动、获取信息并且完成具体任务。

在 Codex 里面 MCP 的入口隐藏得比较深。我们来到左下角的设置，这里有“MCP 服务器”，点击“添加服务器”。

我们来看一个例子，Supabase 是一个开源免费的 PostgreSQL 云端数据库。

官网：https://supabase.com/dashboard/sign-in?returnTo=%2Forg

登录成功后创建一个组织：

会进入创建新项目页面，填写项目名字，生成数据库密码。这里保存好你的数据库密码！我准备给我们的 creative-portfolio（创意作品集） 项目增加后台的数据库，点击创建项目。

创建完成以后，点击顶部的 Connect 按钮。

然后找到 MCP，客户端选择 Codex。我们看到这里给了一个 URL，我们把这个 URL 复制一下。

回到 Codex，选择“流式 HTTP”的传输方式，填写上 URL，MCP 的名字就是 supabase-mcp，下面这些都不用填，直接保存。配置好后，记得重启 Codex。

接下来我们回到 Codex，右上角有一个“切换终端”按钮，我们点击一下，这里就打开了我的 PowerShell 终端。然后我们按照提示输入这个命令。

codex mcp login supabase

浏览器里面自动打开了一个授权窗口，这里我们点击授权。全部这样 Supabase MCP 就配置完成了。注意授权完成以后，一定要重启一次 Codex。

这里输入提示词：“使用 Supabase MCP 创建一个摄影作品展示表。我的需求是把摄影师的作品信息（包含作品标题、图片 URL、拍摄参数、分类标签）存入作品展示表里面。数据库写入操作应该从后端用 Session Pool 的形式写入。”

开始，Codex 调用 Supabase MCP 为我们创建出了作品展示表，然后它在后端加入了一个新的端点，使用 Postgres 连接池的方式来写入数据。任务完成了，Codex 为我们创建了作品表，然后后端使用 Postgres 连接池写入数据，改了前端的表单提交。

现在我们要做的就是在配置文件里面填上 Postgres 的连接地址。这里我用 VS Code 打开，找到 .env.local 这个文件。

然后我们在 Supabase 这边找到 Connect。

找到连接池，把下面这个地址复制一下，注意要把这里替换成自己的密码。

接下来我跟 Codex 说：“我填好了环境变量，你重启一下。”这里重启完成。我们在浏览器里打开 Codex 给我们的链接。

接下来我们回到 Supabase 的网页端，在 Table 这里找到它为我们创建的表，这里看到摄影师的作品数据就写入了数据库。这样我们成功使用 Supabase MCP 给这个 creative-portfolio 项目添加了后端功能，并且把数据成功写入了数据库。

八、部署插件

接下来我再简单介绍一个 Codex 上好用的插件。我们来到插件这里，我准备使用 Netlify。

Netlify 是一个免费提供静态网页、Node.js 或者 Next.js 项目部署的网络服务平台。我们先把它来安装一下，这里点击加号，点击安装，这里弹出了 Netlify 的登录页面。

我先用 GitHub 登录一下，然后点击授权，找到这个 Framework 功能，可以把 Next.js 项目部署到 Netlify 上面。

我让 Codex 帮我把项目部署到 Netlify 上面。

Codex 成功把这个摄影网站部署到了 Netlify，并且给了我们一个公网可用的域名。我们点进去试一下，我们的网站就部署好了，而且成功打开了。使用 Netlify 还有个好处，这个网站的域名在国内是可以直连的。

九、电脑自动化

终于我们来到了最后一个章节，电脑自动化，让 Codex 帮我们操作电脑完成一些工作。在最后一个章节我们就不编程了，我们做一点轻松好玩的事情。

这里我们来到 Codex 的插件，这里要注意 Computer Use 这个插件目前只有 Mac 电脑才可以使用，所以这里我用的 Mac 进行的演示。我们先点击这个加号，把 Computer Use 插件安装一下。

安装完成以后，我们新开一个对话，输入艾特 @，然后选择 Computer Use，然后输入我的指令：“你打开聊天软件，找到老板发送‘你好’。”

Codex 成功完成了操作，然后询问我是否确认发送。这里我确认发送，然后消息就成功发出去了，非常不错。

接下来我们看一个复杂一点的案例。这里我给 Codex 一个 GitHub 上面的进度看板，团队使用这个看板来追踪每个工单的进度。我让 Codex 调用浏览器打开这个看板，把里面的项目进度汇总一下，然后做一个英文版的简报发送给老板。

这里 Codex 申请授权调用我的 Chrome 浏览器，我点击确认，然后它打开了 Chrome 浏览器，查阅了团队所有工单的进度情况，然后它又进行了一些细节确认。Computer Use 这个功能非常的好，因为它使用了一个虚拟鼠标，在后台自动运行，没有占用我当前窗口。它对项目进展做了一个总结，再次询问我是否发送，我点击确认，这样就发送成功了。

接下来我们可以直接把这个流程进行自动化。我说：“很好，你把以上的流程做成一个自动化，然后每天下午五点临下班的时候都发一个简报发送给老板。”

Codex 把这个任务编制成了一个自动化的定时任务，我们可以在左侧“自动化”找到 Codex 创建的这个任务。任务的内容就是打开 GitHub 看板，然后对里面的内容进行一个总结，最后通过聊天软件发送给老板，每天五点执行，非常棒。

这里提醒一下大家，如果想用 Codex 的自动化功能每天定时完成任务，最好我们在设置里面开启这个“运行时防止系统休眠”的开关。这个开关是 Mac 电脑上独有的，Windows 系统不需要处理这一步骤。