解锁Gemini CLI高级用法：Skills、Hooks与Plan Mode实战指南

如果没有运行，会立即提醒用户，并主动询问是否需要启动服务器。另一个困扰很多开发者的问题，就是AI的“上下文臃肿”——当项目复杂度提升，我们需要给AI传递大量专业知识（比如Three.js的特殊用法、项目专属的文档规范、后端接口约定等），这些信息堆积在提示词中，不仅会让AI混淆重点，还会降低响应速度，甚至出现生成内容偏离需求的情况。很多时候，AI生成的代码“不对味”，并不是因为AI能力不够，而是因为

是乐谷

1092人浏览 · 2026-02-20 13:47:10

是乐谷 · 2026-02-20 13:47:10 发布

作为开发者，我们都渴望AI工具既能高效提效，又能完全掌控节奏——既不被“黑箱操作”打乱开发流程，也不用在繁琐的配置中消耗精力。而Gemini CLI的最新升级，恰好解决了这一核心痛点。

在本周的官方直播中，Gemini CLI团队跳出基础用法，深度拆解了面向“高级用户”的三大核心特性：Skills、Hooks与Plan Mode。直播由Greg Baugues主持，邀请到了Gemini CLI团队的Jack Wotherspoon现场演示，从20分钟快速构建部署应用，到“只读模式”的全新亮相，每一个工具都精准衔接AI自主性与开发者意图，彻底打破了“AI工具难掌控、易跑偏”的困境。

对于经常用终端开发、依赖AI辅助编码的开发者来说，这些新特性堪称“效率神器”——既能保留AI的极速提效能力，又能通过自定义配置，让AI完全贴合自身开发习惯，尤其适合复杂、多步骤的项目开发。今天就结合直播干货+实战细节，带大家全面解锁这些高级功能，从“会用”升级为“活用”Gemini CLI。

开篇暴击：20分钟从0到1部署完整应用

为了让大家直观感受Gemini CLI的强大，Jack在直播中现场演示了一个“极限挑战”：用20分钟，从空白工程开始，构建并部署一个名为「Memory Wall」的数字公告板应用。

这个应用并非简单的静态页面，而是基于React、Three.js和Firebase三大技术栈开发，具备动态交互、数据存储等完整功能——从项目初始化、依赖安装，到组件编写、Firebase配置，再到最终部署上线，全程由Gemini CLI辅助完成，仅用20分钟就实现了“从想法到可用产品”的跨越。

而这个「Memory Wall」，不仅是一次性能展示，更成为了当天三大核心特性的“实战 playground”。Jack通过这个项目，逐一演示了Skills、Hooks、Plan Mode如何融入真实开发流程，让大家清晰看到这些功能在实际场景中的具体用法，避免了“纸上谈兵”的尴尬。

可能有同学会疑惑：“AI辅助编码我也用过，为啥能这么快？” 核心原因就在于Gemini CLI的特性设计——它不只是“生成代码”，更是“理解开发流程、适配开发习惯”，而接下来的三大特性，正是这一设计理念的最佳体现。

核心特性拆解：三大功能，彻底掌控AI开发节奏

Hooks：确定性控制，解决AI“不可控”痛点

用过AI编码工具的开发者，大概率都遇到过这样的问题：AI生成的代码看似可行，却忽略了本地开发环境配置；或者执行操作时，不小心删除了敏感文件、写出不符合规范的杂乱代码——这本质上是AI的“非确定性”导致的，它无法预判我们的本地环境和开发规范。

而Gemini CLI新增的Hooks功能，正是为了解决这个痛点。Hooks本质上是“生命周期脚本”，可以在特定的开发节点自动执行，比如会话启动时、AI调用工具前、代码生成后，相当于给AI加上了“可控开关”，让AI的行为变得可预测、可约束。

实战场景：3个高频Hooks用法

Jack在直播中演示了多个实用场景，结合日常开发需求，整理了3个最值得关注的用法，拿来就能用：

Dev Server Hook（环境检查）：这是最常用的一个Hook。它会在Gemini CLI会话启动时，自动检查本地开发服务器是否正在运行；如果没有运行，会立即提醒用户，并主动询问是否需要启动服务器。对于前端开发者来说，再也不用手动切换终端启动服务，也避免了AI生成代码后因服务未启动而无法调试的问题，大幅提升开发连贯性。
安全守卫Hook（代码校验）：AI生成代码时，难免会出现格式混乱、不符合项目规范，甚至误删敏感文件的情况。通过Hooks，我们可以预先配置“安全守卫”脚本——比如自动运行ESLint、Prettier等代码检查工具，让AI生成的代码先经过校验，不符合规范的代码会被自动修正；同时还能拦截删除操作，防止敏感文件（如配置文件、密钥文件）被误删，从源头规避风险。
背景任务联动（Control + B快捷键）：这是一个隐藏小技巧。Jack推荐大家结合新增的Background Tasks功能（快捷键Control + B），通过Hook让开发服务器在后台运行——这样既不会占用终端窗口，也不会阻塞我们与Gemini CLI的对话，实现“AI辅助编码+本地调试”并行，多任务开发效率直接翻倍。

简单来说，Hooks的核心价值就是“把控制权交还给开发者”：AI负责高效生成，Hook负责规范约束，两者结合，既高效又安全。

Skills（专家技能）：告别上下文臃肿，精准调用专业能力

另一个困扰很多开发者的问题，就是AI的“上下文臃肿”——当项目复杂度提升，我们需要给AI传递大量专业知识（比如Three.js的特殊用法、项目专属的文档规范、后端接口约定等），这些信息堆积在提示词中，不仅会让AI混淆重点，还会降低响应速度，甚至出现生成内容偏离需求的情况。

而Skills（专家技能）功能，正是为解决这一问题而生。Jack在直播中形象地将其比喻为“书架上的专业书籍”——不需要把所有书都堆在桌上，而是需要哪本，就取哪本，用完再放回，既整洁又高效。

Gemini CLI的Skills本质上是“模块化的专业知识包”，可以将特定领域的知识、规范、用法封装起来，只有在需要时才触发调用，无需在每次提示中重复输入，彻底解决上下文臃肿问题。

两大核心优势+实战用法

Skills的设计的核心是“精准、便捷”，结合直播演示，重点关注这两点即可快速上手：

渐进式披露（Progressive Disclosure）：这是Skills的核心逻辑。它不会一次性将所有专业知识加载到上下文的中，而是根据当前开发场景，自动触发对应的Skill。比如当你需要用Three.js实现3D效果时，Gemini CLI会自动调用Three.js相关的Skill，加载对应的API文档、最佳实践；当你切换到文档编写场景时，会自动触发文档规范Skill，无需手动切换，灵活又高效。
内置Skill生成器（零成本定制）：最贴心的是，Gemini CLI自带了“Skill生成器”，无需手动编写复杂配置，就能定制专属Skill。比如你需要一个符合项目规范的“文档编写Skill”，只需在终端输入提示：“Create a docs-writer skill for this project”，Gemini CLI就会启动交互式引导，一步步询问你的需求（比如文档格式、语气、核心要点），自动生成专属Skill，哪怕是新手也能轻松定制。

对于多技术栈项目、大型团队开发来说，Skills的价值尤为明显——可以将团队的编码规范、项目约定、专属工具用法封装成Skill，全员共用，既保证了代码一致性，也降低了新人上手成本。

Ask User工具：AI不瞎猜，精准对齐你的开发意图

很多时候，AI生成的代码“不对味”，并不是因为AI能力不够，而是因为它无法精准理解我们的模糊需求——比如“优化这个组件”，AI可能会优先优化性能，而你实际想要的是优化UI样式；“完善这个接口”，AI可能会补充参数校验，而你需要的是增加异常处理。

在过去，我们只能通过反复修改提示词，让AI逐步贴近需求，耗时又费力。而Gemini CLI新增的「Ask User」工具，彻底改变了这种模式——它会在遇到模糊需求时，主动“停下来问你”，而不是盲目猜测。

正如Jack在直播中演示的那样：当你让Gemini CLI“优化一个React组件”，它不会直接生成代码，而是会弹出交互式对话，通过多个选择题、是非题，明确你的需求：“你希望优先优化UI样式、性能，还是可维护性？”“是否需要兼容移动端？”“是否保留原有组件结构？”

只有当你明确回答这些问题，AI才会开始生成代码，确保每一行代码都贴合你的真实意图。这种“主动询问”的模式，不仅减少了提示词的反复修改，也大幅降低了代码返工率，尤其适合需求模糊、细节较多的开发场景。

而且「Ask User」工具的交互非常灵活，支持多种提问形式：单选、多选、是非题，甚至可以自定义输入，完全适配不同场景的需求，让AI从“被动执行”升级为“主动对齐”。

Plan Mode（预览版）：先规划，再执行，杜绝无效操作

如果说前面三个功能是“提升效率、规范行为”，那么Plan Mode（计划模式）就是“规避风险、掌控全局”——这也是本次直播中最受期待的功能，目前处于预览阶段，但其实用性已经拉满。

根据Gemini CLI官方文档介绍，Plan Mode是一种安全的只读模式，专门用于复杂变更的研究和设计，在该模式下，AI不会对本地文件进行任何修改，仅专注于“调研和规划”，从源头避免误操作带来的风险。

对于复杂的多步骤项目（比如重构一个模块、集成一个新框架、修复一个深层bug），我们往往会因为“思路不清晰”，导致开发过程混乱，甚至出现越改越乱的情况。而Plan Mode的核心作用，就是帮我们“理清思路、做好规划”，再动手执行。

核心流程：两步实现“可控开发”

Plan Mode的用法非常简单，核心分为两步，结合官方演示整理如下，目前可通过快捷键Shift + Tab切换到该模式：

第一步：只读调研，生成作战计划：开启Plan Mode后，Gemini CLI会自动切换为“只读研究员”模式，不会执行任何修改文件、启动服务等操作。它会先深入探索你的代码库、相关外部文档（如API文档、框架文档），梳理出当前任务的核心难点、关键步骤、潜在风险，然后生成一份结构化的“作战计划”——明确每一步要做什么、怎么做、优先级如何，甚至会标注出可能出现的问题及解决方案。
第二步：用户审批，再执行操作：生成计划后，Gemini CLI会将计划呈现给你，等待你的反馈和审批。你可以仔细查看计划，修改不合理的步骤、调整优先级，甚至补充自己的思路；只有当你给出“绿灯”（确认批准）后，Gemini CLI才会退出Plan Mode，切换到执行模式，按照计划逐步执行操作，确保每一步都在你的掌控之中。

对于新手开发者、复杂项目重构来说，Plan Mode堪称“救命神器”——它能帮你理清开发思路，规避无效操作，避免因为思路混乱导致的代码返工，同时也能让你更清晰地掌控项目进度，做到“心中有数、手上有谱”。

延伸资源：深入学习，解锁更多可能

直播中还分享了很多实用资源，无论你是想回顾直播细节，还是想系统学习Gemini CLI，这些资源都能帮到你，整理如下，建议收藏：

观看直播回放：如果错过了本次直播，不用担心，官方已经放出了完整回放，点击链接即可观看（原文链接可在Gemini CLI官方社群获取），回放中包含更多细节演示，比文字整理更直观。
免费实战课程：DeepLearning.ai联合Gemini推出了免费的Gemini CLI实战课程，从基础用法到高级特性，全程手把手教学，适合想系统提升的开发者，零基础也能轻松上手。
参与开源贡献：Gemini CLI是完全开源的项目（基于Google开源协议），如果你在使用过程中有新想法、新需求，或者发现了bug，可以前往GitHub仓库查看“Help Wanted”标签，参与开源贡献，和官方团队一起完善这个工具，同时也能提升自己的技术能力。

预告：下周重点——Antigravity Editor与Agent Manager

直播最后，官方也预告了下周的直播重点：将跳出终端，深入探索Antigravity Editor（反重力编辑器）和Agent Manager（智能体管理器）。

根据预告，下周将演示如何用Gemini Flash快速生成应用，以及如何通过Antigravity Editor实现“可视化操作”——无需编写代码，只需点击、拖拽，就能修改UI样式、调整组件结构，实现“所见即所得”的AI开发体验。对于前端开发者、UI设计师来说，这无疑是又一个“效率神器”，值得期待。

总结：Gemini CLI的核心价值——让AI“懂你，更听你话”

回顾本次直播的核心内容，Skills、Hooks、Plan Mode三大特性，本质上都是围绕一个核心：让AI工具从“被动执行”升级为“主动适配、可控可管”。

Gemini CLI作为Google推出的AI终端助手，不同于其他AI编码工具，它深度融入开发者的终端工作流，支持Gemini 2.5 Pro模型，拥有100万上下文窗口，每天可免费发起1000次请求、每分钟60次请求，兼顾了高效性和实用性。而本次新增的高级特性，更是填补了“AI高效与开发者掌控”之间的鸿沟：