作为开发者,我们都渴望AI工具既能高效提效,又能完全掌控节奏——既不被“黑箱操作”打乱开发流程,也不用在繁琐的配置中消耗精力。而Gemini CLI的最新升级,恰好解决了这一核心痛点。

在本周的官方直播中,Gemini CLI团队跳出基础用法,深度拆解了面向“高级用户”的三大核心特性:Skills、Hooks与Plan Mode。直播由Greg Baugues主持,邀请到了Gemini CLI团队的Jack Wotherspoon现场演示,从20分钟快速构建部署应用,到“只读模式”的全新亮相,每一个工具都精准衔接AI自主性与开发者意图,彻底打破了“AI工具难掌控、易跑偏”的困境。

对于经常用终端开发、依赖AI辅助编码的开发者来说,这些新特性堪称“效率神器”——既能保留AI的极速提效能力,又能通过自定义配置,让AI完全贴合自身开发习惯,尤其适合复杂、多步骤的项目开发。今天就结合直播干货+实战细节,带大家全面解锁这些高级功能,从“会用”升级为“活用”Gemini CLI。

开篇暴击:20分钟从0到1部署完整应用

为了让大家直观感受Gemini CLI的强大,Jack在直播中现场演示了一个“极限挑战”:用20分钟,从空白工程开始,构建并部署一个名为「Memory Wall」的数字公告板应用。

这个应用并非简单的静态页面,而是基于React、Three.js和Firebase三大技术栈开发,具备动态交互、数据存储等完整功能——从项目初始化、依赖安装,到组件编写、Firebase配置,再到最终部署上线,全程由Gemini CLI辅助完成,仅用20分钟就实现了“从想法到可用产品”的跨越。

而这个「Memory Wall」,不仅是一次性能展示,更成为了当天三大核心特性的“实战 playground”。Jack通过这个项目,逐一演示了Skills、Hooks、Plan Mode如何融入真实开发流程,让大家清晰看到这些功能在实际场景中的具体用法,避免了“纸上谈兵”的尴尬。

可能有同学会疑惑:“AI辅助编码我也用过,为啥能这么快?” 核心原因就在于Gemini CLI的特性设计——它不只是“生成代码”,更是“理解开发流程、适配开发习惯”,而接下来的三大特性,正是这一设计理念的最佳体现。

核心特性拆解:三大功能,彻底掌控AI开发节奏

  1. Hooks:确定性控制,解决AI“不可控”痛点

用过AI编码工具的开发者,大概率都遇到过这样的问题:AI生成的代码看似可行,却忽略了本地开发环境配置;或者执行操作时,不小心删除了敏感文件、写出不符合规范的杂乱代码——这本质上是AI的“非确定性”导致的,它无法预判我们的本地环境和开发规范。

而Gemini CLI新增的Hooks功能,正是为了解决这个痛点。Hooks本质上是“生命周期脚本”,可以在特定的开发节点自动执行,比如会话启动时、AI调用工具前、代码生成后,相当于给AI加上了“可控开关”,让AI的行为变得可预测、可约束。

实战场景:3个高频Hooks用法

Jack在直播中演示了多个实用场景,结合日常开发需求,整理了3个最值得关注的用法,拿来就能用:

  • Dev Server Hook(环境检查):这是最常用的一个Hook。它会在Gemini CLI会话启动时,自动检查本地开发服务器是否正在运行;如果没有运行,会立即提醒用户,并主动询问是否需要启动服务器。对于前端开发者来说,再也不用手动切换终端启动服务,也避免了AI生成代码后因服务未启动而无法调试的问题,大幅提升开发连贯性。

  • 安全守卫Hook(代码校验):AI生成代码时,难免会出现格式混乱、不符合项目规范,甚至误删敏感文件的情况。通过Hooks,我们可以预先配置“安全守卫”脚本——比如自动运行ESLint、Prettier等代码检查工具,让AI生成的代码先经过校验,不符合规范的代码会被自动修正;同时还能拦截删除操作,防止敏感文件(如配置文件、密钥文件)被误删,从源头规避风险。

  • 背景任务联动(Control + B快捷键):这是一个隐藏小技巧。Jack推荐大家结合新增的Background Tasks功能(快捷键Control + B),通过Hook让开发服务器在后台运行——这样既不会占用终端窗口,也不会阻塞我们与Gemini CLI的对话,实现“AI辅助编码+本地调试”并行,多任务开发效率直接翻倍。

简单来说,Hooks的核心价值就是“把控制权交还给开发者”:AI负责高效生成,Hook负责规范约束,两者结合,既高效又安全。

  1. Skills(专家技能):告别上下文臃肿,精准调用专业能力

另一个困扰很多开发者的问题,就是AI的“上下文臃肿”——当项目复杂度提升,我们需要给AI传递大量专业知识(比如Three.js的特殊用法、项目专属的文档规范、后端接口约定等),这些信息堆积在提示词中,不仅会让AI混淆重点,还会降低响应速度,甚至出现生成内容偏离需求的情况。

而Skills(专家技能)功能,正是为解决这一问题而生。Jack在直播中形象地将其比喻为“书架上的专业书籍”——不需要把所有书都堆在桌上,而是需要哪本,就取哪本,用完再放回,既整洁又高效。

Gemini CLI的Skills本质上是“模块化的专业知识包”,可以将特定领域的知识、规范、用法封装起来,只有在需要时才触发调用,无需在每次提示中重复输入,彻底解决上下文臃肿问题。

两大核心优势+实战用法

Skills的设计的核心是“精准、便捷”,结合直播演示,重点关注这两点即可快速上手:

  • 渐进式披露(Progressive Disclosure):这是Skills的核心逻辑。它不会一次性将所有专业知识加载到上下文的中,而是根据当前开发场景,自动触发对应的Skill。比如当你需要用Three.js实现3D效果时,Gemini CLI会自动调用Three.js相关的Skill,加载对应的API文档、最佳实践;当你切换到文档编写场景时,会自动触发文档规范Skill,无需手动切换,灵活又高效。

  • 内置Skill生成器(零成本定制):最贴心的是,Gemini CLI自带了“Skill生成器”,无需手动编写复杂配置,就能定制专属Skill。比如你需要一个符合项目规范的“文档编写Skill”,只需在终端输入提示:“Create a docs-writer skill for this project”,Gemini CLI就会启动交互式引导,一步步询问你的需求(比如文档格式、语气、核心要点),自动生成专属Skill,哪怕是新手也能轻松定制。

对于多技术栈项目、大型团队开发来说,Skills的价值尤为明显——可以将团队的编码规范、项目约定、专属工具用法封装成Skill,全员共用,既保证了代码一致性,也降低了新人上手成本。

  1. Ask User工具:AI不瞎猜,精准对齐你的开发意图

很多时候,AI生成的代码“不对味”,并不是因为AI能力不够,而是因为它无法精准理解我们的模糊需求——比如“优化这个组件”,AI可能会优先优化性能,而你实际想要的是优化UI样式;“完善这个接口”,AI可能会补充参数校验,而你需要的是增加异常处理。

在过去,我们只能通过反复修改提示词,让AI逐步贴近需求,耗时又费力。而Gemini CLI新增的「Ask User」工具,彻底改变了这种模式——它会在遇到模糊需求时,主动“停下来问你”,而不是盲目猜测。

正如Jack在直播中演示的那样:当你让Gemini CLI“优化一个React组件”,它不会直接生成代码,而是会弹出交互式对话,通过多个选择题、是非题,明确你的需求:“你希望优先优化UI样式、性能,还是可维护性?”“是否需要兼容移动端?”“是否保留原有组件结构?”

只有当你明确回答这些问题,AI才会开始生成代码,确保每一行代码都贴合你的真实意图。这种“主动询问”的模式,不仅减少了提示词的反复修改,也大幅降低了代码返工率,尤其适合需求模糊、细节较多的开发场景。

而且「Ask User」工具的交互非常灵活,支持多种提问形式:单选、多选、是非题,甚至可以自定义输入,完全适配不同场景的需求,让AI从“被动执行”升级为“主动对齐”。

  1. Plan Mode(预览版):先规划,再执行,杜绝无效操作

如果说前面三个功能是“提升效率、规范行为”,那么Plan Mode(计划模式)就是“规避风险、掌控全局”——这也是本次直播中最受期待的功能,目前处于预览阶段,但其实用性已经拉满。

根据Gemini CLI官方文档介绍,Plan Mode是一种安全的只读模式,专门用于复杂变更的研究和设计,在该模式下,AI不会对本地文件进行任何修改,仅专注于“调研和规划”,从源头避免误操作带来的风险。

对于复杂的多步骤项目(比如重构一个模块、集成一个新框架、修复一个深层bug),我们往往会因为“思路不清晰”,导致开发过程混乱,甚至出现越改越乱的情况。而Plan Mode的核心作用,就是帮我们“理清思路、做好规划”,再动手执行。

核心流程:两步实现“可控开发”

Plan Mode的用法非常简单,核心分为两步,结合官方演示整理如下,目前可通过快捷键Shift + Tab切换到该模式:

  • 第一步:只读调研,生成作战计划:开启Plan Mode后,Gemini CLI会自动切换为“只读研究员”模式,不会执行任何修改文件、启动服务等操作。它会先深入探索你的代码库、相关外部文档(如API文档、框架文档),梳理出当前任务的核心难点、关键步骤、潜在风险,然后生成一份结构化的“作战计划”——明确每一步要做什么、怎么做、优先级如何,甚至会标注出可能出现的问题及解决方案。

  • 第二步:用户审批,再执行操作:生成计划后,Gemini CLI会将计划呈现给你,等待你的反馈和审批。你可以仔细查看计划,修改不合理的步骤、调整优先级,甚至补充自己的思路;只有当你给出“绿灯”(确认批准)后,Gemini CLI才会退出Plan Mode,切换到执行模式,按照计划逐步执行操作,确保每一步都在你的掌控之中。

对于新手开发者、复杂项目重构来说,Plan Mode堪称“救命神器”——它能帮你理清开发思路,规避无效操作,避免因为思路混乱导致的代码返工,同时也能让你更清晰地掌控项目进度,做到“心中有数、手上有谱”。

延伸资源:深入学习,解锁更多可能

直播中还分享了很多实用资源,无论你是想回顾直播细节,还是想系统学习Gemini CLI,这些资源都能帮到你,整理如下,建议收藏:

  • 观看直播回放:如果错过了本次直播,不用担心,官方已经放出了完整回放,点击链接即可观看(原文链接可在Gemini CLI官方社群获取),回放中包含更多细节演示,比文字整理更直观。

  • 免费实战课程:DeepLearning.ai联合Gemini推出了免费的Gemini CLI实战课程,从基础用法到高级特性,全程手把手教学,适合想系统提升的开发者,零基础也能轻松上手。

  • 参与开源贡献:Gemini CLI是完全开源的项目(基于Google开源协议),如果你在使用过程中有新想法、新需求,或者发现了bug,可以前往GitHub仓库查看“Help Wanted”标签,参与开源贡献,和官方团队一起完善这个工具,同时也能提升自己的技术能力。

预告:下周重点——Antigravity Editor与Agent Manager

直播最后,官方也预告了下周的直播重点:将跳出终端,深入探索Antigravity Editor(反重力编辑器)和Agent Manager(智能体管理器)。

根据预告,下周将演示如何用Gemini Flash快速生成应用,以及如何通过Antigravity Editor实现“可视化操作”——无需编写代码,只需点击、拖拽,就能修改UI样式、调整组件结构,实现“所见即所得”的AI开发体验。对于前端开发者、UI设计师来说,这无疑是又一个“效率神器”,值得期待。

总结:Gemini CLI的核心价值——让AI“懂你,更听你话”

回顾本次直播的核心内容,Skills、Hooks、Plan Mode三大特性,本质上都是围绕一个核心:让AI工具从“被动执行”升级为“主动适配、可控可管”。

Gemini CLI作为Google推出的AI终端助手,不同于其他AI编码工具,它深度融入开发者的终端工作流,支持Gemini 2.5 Pro模型,拥有100万上下文窗口,每天可免费发起1000次请求、每分钟60次请求,兼顾了高效性和实用性。而本次新增的高级特性,更是填补了“AI高效与开发者掌控”之间的鸿沟:

  • Hooks解决“不可控”,让AI行为符合你的开发规范;

  • Skills解决“不精准”,让AI只调用你需要的专业能力;

  • Ask User解决“不理解”,让AI精准对齐你的开发意图;

  • Plan Mode解决“不清晰”,让复杂项目开发思路更明确。

对于终端开发者、全栈开发者来说,Gemini CLI的这些升级,无疑会大幅提升开发效率——既能借助AI的力量,减少重复编码、理清开发思路,又能完全掌控开发节奏,避免AI“帮倒忙”。

最后,想问大家一个问题:你平时会用AI工具辅助终端开发吗?Gemini CLI的这些新特性,哪一个最戳你?欢迎在评论区留言讨论,一起交流AI开发的高效技巧~

👉 补充链接:

  • Gemini CLI官方文档:https://github.com/google-gemini/gemini-cli

  • Plan Mode官方文档(预览版):https://github.com/google-gemini/gemini-cli/pull/18582/files

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐