在终端里召唤 AI：Gemini CLI 全场景上手指南

它将强大的 Gemini 大模型能力直接集成到你每天使用的终端中，旨在成为开发者的“第二大脑”。虽然通过 Google 账号登录是最简单的方式，但手动配置 API Key 能提供更大的灵活性，例如在服务器环境中使用，或进行更精细的权限管理。虽然 Gemini CLI 是终端工具，但在 VS Code 的内置终端中使用，能获得最佳的“编码+AI”体验。当你在这个项目目录下运行 Gemini CLI

这雪真白哈

497人浏览 · 2025-09-25 18:14:34

这雪真白哈 · 2025-09-25 18:14:34 发布

在终端里召唤AI：Gemini CLI 全场景上手指南

在这里插入图片描述

导语：在这个 AI 驱动的开发时代，前端开发者虽然不直接训练模型，但高效使用 AI 已成为核心竞争力。当面对 Cursor 等工具的网络限制或高昂费用时，不妨尝试一下 Google 官方出品、且提供慷慨免费额度的 Gemini CLI，让你的终端变身强大的 AI 编程伙伴。

1. Gemini CLI：不止于“另一个AI工具”

Gemini CLI 是 Google 官方推出的一款命令行界面（CLI）智能助手。它将强大的 Gemini 大模型能力直接集成到你每天使用的终端中，旨在成为开发者的“第二大脑”。

核心定位

原生终端体验：无需切换窗口，在你熟悉的命令行环境中直接与 AI 交互。
全能编程助手：不仅能写代码、查 Bug，还能解释代码逻辑、优化性能、生成文档。
强大的多模态能力：除了文本，它还能理解图片信息（如错误截图），为问题诊断提供更多维度。
无缝工具集成：可以调用内置的文件系统工具、Web 搜索工具等，将 AI 的思考与实际操作连接起来。
开源与免费：它是开源项目，并且在预览期间为个人开发者提供了非常可观的免费使用额度。

GitHub 仓库地址：https://github.com/google-gemini/gemini-cli

2. 核心功能与工作流解析

Gemini CLI 的设计哲学是“让 AI 无缝融入开发流程”，而不是成为一个需要频繁切换的“外部工具”。

2.1 核心工作流

它的工作模式非常直观，可以理解为一个高效的闭环：

用户输入：你在终端中输入自然语言指令、代码片段，或者引用一个文件。
AI 理解与思考：Gemini CLI 将你的输入发送给后端的 Gemini API（默认使用 gemini-2.5-pro 模型）。
工具调用：如果需要，AI 可以自动触发内置工具，例如读取某个配置文件、在网上搜索最新的技术方案。
生成响应：AI 结合自身知识和工具返回的信息，生成最终的答案或代码。
结果展示：结果以清晰、美观的格式直接呈现在你的终端里。

2.2 核心特性一览

特性	描述	价值
自然语言交互	用日常语言向 AI 提问，无需学习复杂的指令格式。	降低使用门槛，专注于问题本身，而非沟通方式。
代码理解与生成	可以分析你提供的代码，找出问题、解释逻辑、甚至重构成更优的版本。	极大提升代码审查、调试和重构的效率。
文件引用 (`@`)	通过 `@` 符号直接引用本地文件，如 `@./src/utils.js`。	让 AI 能深入你的项目上下文，提供更精准的帮助。
多模态支持	支持传入图片，特别是对于 UI 设计、布局问题或错误截图的分析非常有用。	打破纯文本的限制，解决更多视觉相关的问题。
内置工具箱	集成了文件系统操作、Web 搜索等基础工具，AI 可以按需自动使用。	实现“思考”与“行动”的闭环，无需用户手动执行中间步骤。
高度可定制	通过创建 `GEMINI.md` 文件，可以为不同项目或目录定制化 AI 的行为和上下文。	让 AI 更好地适应你的特定工作流和项目规范。

3. 与主流工具（如 Claude Code）的横向对比

为了让你更清晰地了解 Gemini CLI 的定位，我们将其与当前流行的 Claude Code 进行一个简要对比。

维度	Gemini CLI	Claude Code	备注
运行环境	终端 (CLI)	IDE 插件 (VSCode/IntelliJ)	这是最核心的区别，决定了它们融入开发工作流的方式。
响应速度	较快，但在处理超大规模、极度复杂的任务时可能稍逊一筹。	非常快，尤其在处理整个代码库级别的任务时表现出色。	文章提到的案例显示 Claude 在复杂任务上快约 5 倍。
代码质量	优秀，尤其在代码生成、逻辑实现和文章撰写方面。	顶尖，特别是在 UI/UX 设计、代码架构和长期项目理解上。	两者都远优于普通开发者，但各有侧重。
工具生态	正在发展中，内置基础工具，生态系统尚在建设。	非常成熟，拥有庞大且经过实战检验的工具和插件生态。	Claude 作为老牌产品，在生态完善度上有天然优势。
成本模式	免费额度慷慨 (每日1000次请求)，超出后可付费。	订阅制，通常需要按月或按年付费，成本较高。	Gemini CLI 对个人开发者和小团队的友好度更高。
核心优势	原生终端体验、免费、轻量、官方出品	IDE 深度集成、性能极致、生态成熟	选择哪个工具，很大程度上取决于你的主要工作环境和预算。

结论：如果你是一个重度终端用户，追求极致的轻量化和免费的高性价比，Gemini CLI 是一个绝佳选择。如果你主要在 VSCode 等 IDE 中工作，且愿意为顶级性能和成熟生态付费，Claude Code 可能更适合你。

4. 详细安装与配置指南

安装 Gemini CLI 的过程非常简单，主要分为三步：环境检查、安装、配置。

4.1 前置条件

Node.js：确保你的电脑上已安装 Node.js 18 或更高版本。
终端：任何主流终端都可以，如 macOS/Linux 的 Terminal/iTerm2，或 Windows 的 PowerShell。

检查 Node.js 版本：

node -v
# 示例输出: v20.11.1

4.2 全局安装

打开你的终端，运行以下 npm 命令进行全局安装：

npm install -g @google/gemini-cli

4.3 运行与首次配置

安装完成后，在终端中直接输入命令启动：

gemini

首次运行时，它会引导你完成几个关键设置：

选择主题：
- 你会看到一个列表，如 ANSI Dark, Dracula Dark, GitHub Light 等。
- 使用方向键选择一个你喜欢的颜色主题，然后按 Enter 确认。
授权登录：
- 接下来，你需要选择授权方式。
- 推荐：Login with Google：最简便的方式。系统会生成一个链接，复制并在浏览器中打开，然后用你的 Google 账号登录授权即可。
- 备选：Gemini API Key：如果你已有 API Key，可以选择此项并手动输入。

安全提示：请务必确保你是从官方渠道安装的 @google/gemini-cli 包，再进行登录操作。

5. 获取并配置 Gemini API Key (进阶)

虽然通过 Google 账号登录是最简单的方式，但手动配置 API Key 能提供更大的灵活性，例如在服务器环境中使用，或进行更精细的权限管理。

5.1 获取 API Key

访问 Google AI Studio：
- 打开浏览器，访问 https://aistudio.google.com/app/apikey
创建密钥：
- 如果尚未登录，请先登录你的 Google 账号。
- 点击页面上醒目的 “Create API key” 按钮。
复制并保存：
- 系统会立即生成一个新的 API Key。请立即复制它。
- 这是你唯一一次看到完整密钥的机会，请务必妥善保管，不要泄露给他人。

5.2 配置环境变量

为了让 Gemini CLI 能够使用你的 API Key，你需要将其设置为环境变量。

在 macOS / Linux 上：

临时生效（当前终端会话）：
```
export GEMINI_API_KEY="YOUR_API_KEY"
```
永久生效（推荐）：
- 打开你的 Shell 配置文件。如果你使用的是 Zsh，文件是 ~/.zshrc；如果是 Bash，则是 ~/.bashrc 或 ~/.bash_profile。
```
# 使用 Zsh 为例
echo 'export GEMINI_API_KEY="YOUR_API_KEY"' >> ~/.zshrc
```
- 让配置立即生效：
```
source ~/.zshrc
```

在 Windows (PowerShell) 上：

临时生效（当前 PowerShell 会话）：
```
$env:GEMINI_API_KEY="YOUR_API_KEY"
```

永久生效（推荐）：

[Environment]::SetEnvironmentVariable("GEMINI_API_KEY", "YOUR_API_KEY", "User")

设置后需要重启 PowerShell 才能生效。

6. 实战场景：从入门到精通

理论说得再多，不如上手实践。下面我们通过几个典型场景，带你感受 Gemini CLI 的强大之处。

场景一：快速问答（入门）

这是最基础的用法，就像在终端里打开了一个聊天窗口。

> GEMINI
> 解释一下什么是 RESTful API，并用 Express.js 举个简单的例子。

Gemini CLI 会直接在终端里返回一个清晰的解释，并附上一段可以直接运行的 Express.js 代码示例。

场景二：代码调试与优化（进阶）

假设你有一个 utils.js 文件，里面的 fibonacci 函数运行效率很低，你想让 AI 帮你看看。

// utils.js
function fibonacci(n) {
  if (n <= 1) return n;
  return fibonacci(n - 1) + fibonacci(n - 2);
}

你可以这样提问：

> GEMINI
> @./utils.js
> 这个 fibonacci 函数性能很差，能帮我分析一下原因并优化它吗？

AI 会分析出这是因为大量的重复计算导致的，并为你提供一个使用“备忘录”（Memoization）或“动态规划”优化后的版本。

场景三：项目级代码生成（高级）

这是最能体现其价值的场景。让我们尝试让它帮我们从零开始创建一个小型项目。

> GEMINI
> 帮我创建一个基于 Node.js 和 Express 的待办事项（Todo）API。
> 要求：
> 1. 包含创建、读取、更新、删除 (CRUD) 所有功能。
> 2. 使用 JSON 文件作为简易数据库。
> 3. 代码结构要清晰，分路由、控制器和数据访问层。
> 4. 为每个文件添加简要注释。

Gemini CLI 会理解你的需求，并可能一次性为你生成多个文件，例如：

server.js (主入口)
routes/todos.js (路由定义)
controllers/todoController.js (业务逻辑)
models/todoModel.js (数据读写)
db.json (数据库文件)

它甚至会告诉你如何安装依赖 (npm install express body-parser) 和如何启动服务 (node server.js)。

7. 在 VS Code 中集成使用

虽然 Gemini CLI 是终端工具，但在 VS Code 的内置终端中使用，能获得最佳的“编码+AI”体验。

打开 VS Code 终端：Ctrl + `` (Windows/Linux) 或 Cmd + `` (macOS)。
启动 Gemini CLI：输入 gemini 并回车。
无缝协作：
- 你可以在代码编辑器中写代码，在下方终端中向 AI 提问。
- 当 AI 生成代码后，你可以直接复制到编辑器中，或者让 AI 尝试自动写入文件（如果它支持该功能）。

网络代理设置：
如果你的网络环境需要代理才能访问外部服务，请在启动 gemini 之前，在终端中执行以下命令（请将端口号 7890 替换为你的代理软件实际使用的端口）：

export https_proxy=http://127.0.0.1:7890
export http_proxy=http://127.0.0.1:7890
export all_proxy=socks5://127.0.0.1:7890

8. 高级技巧与最佳实践

8.1 善用 `GEMINI.md` 进行定制化

在你的项目根目录下创建一个 GEMINI.md 文件，可以为该项目提供“专属提示词”。这相当于为 AI 设定了角色和背景知识。

GEMINI.md 示例：

# Project Context
You are now an expert on the "Acme Corp" e-commerce backend project.
This project uses Node.js, Express, and MongoDB.
Our code style follows Airbnb JavaScript Style Guide.
Please keep all generated code consistent with these standards.

# Important Notes
- **Database**: The main database connection string is stored in `process.env.MONGO_URI`.
- **Authentication**: We use JWT tokens for authentication. The secret is in `process.env.JWT_SECRET`.
- **Error Handling**: Always use the centralized error handler in `middleware/errorHandler.js`.

当你在这个项目目录下运行 Gemini CLI 时，它会自动读取这个文件，从而对你的项目有更深的理解。

8.2 明确指令，获得更好结果

AI 的输出质量高度依赖于你的输入质量。一个好的指令通常包含：

清晰的目标：“帮我写一个…”
具体的约束：“使用 React Hooks，不要用 Class Component…”
期望的输出格式：“以表格形式列出所有 API 端点…”

8.3 利用上下文记忆

在同一个会话中，Gemini CLI 会记住你之前的对话内容。这意味着你可以进行多轮、有递进关系的提问，而无需每次都重复背景信息。

9. 风险、局限与应对策略

网络依赖：它完全依赖网络连接到 Google 的 API 服务器。
- 应对：确保网络稳定。国内用户需配置可靠的网络代理。
免费额度限制：每日 1000 次请求对于个人开发通常足够，但对于多窗口并行或自动化脚本调用可能会耗尽。
- 应对：合理规划使用场景。超出额度后，它会自动切换到性能稍弱的 Gemini 2.5 Flash 模型，或你可以选择付费升级。
模型幻觉：任何大语言模型都可能生成看似合理但实际上错误的信息（“幻觉”）。
- 应对：对于关键代码或信息，特别是涉及安全和生产环境的，务必进行人工复核和测试。
安全性：不要向 AI 提供任何敏感信息，如 API 密钥、密码、数据库连接字符串等。
- 应对：使用环境变量来管理敏感信息。Gemini CLI 本身也会提醒你不要分享 API 密钥。

10. 总结与未来展望

Gemini CLI 代表了一种将 AI 深度融入开发者日常工作流的新范式。它不是一个需要你“去访问”的网站或应用，而是一个“就在这里”的、随时待命的智能伙伴。

对于个人开发者：它是一个免费、强大、高效的学习和开发助手。
对于小团队：它可以作为团队知识库和开发规范的“接口”，提升团队协作和代码一致性。
对于未来：随着模型能力的不断进化和工具生态的日益丰富，我们有理由相信，像 Gemini CLI 这样的“原生 AI 应用”将成为主流，彻底改变我们构建软件的方式。

下一步，你可以：