先建立认知:AI 编程为什么从“对话”走向“行动”;
再讲清底层:Function Call、MCP、Skill、Agent 如何协作;
然后落地实践:Claude Code 怎么装、怎么用、适合哪些场景;
最后收束到工程化:Code Review、技术债、Loop Engineering 与安全治理。


《Vibe Coding 技术分享》新版 PPT

从 Function Call 到 Agent 的完整演进之路

INTERNAL TECHNICAL SHARING · 内部技术分享


01|封面页

Vibe Coding 技术分享

从 Function Call 到 Agent 的完整演进之路

副标题:
让 AI 从“会回答问题”进化为“能执行任务”的工程化方法

页脚:
Internal Technical Sharing · 内部技术分享

版式建议

  • 背景可以使用深色科技风。
  • 中间放一条演进链路:
Prompt → Function Call → Tool → Skill → MCP → Agent → Loop

02|目录

这次分享会从认知、工具、协议、实践和治理五个层次展开,帮助大家建立一套完整的 AI Coding 技术地图。

目录

  1. AI Coding 的范式变化
    从对话 AI 到行动 AI,理解 AI 编程为什么正在发生质变。

  2. Agent 核心概念地图
    梳理 Function Call、Tool、Skill、MCP、Agent、Loop 之间的关系。

  3. Claude Code 本地实践
    介绍 Claude Code 的定位、工作流程、环境安装和典型使用方式。

  4. AI Coding 高效使用指南
    识别适合 AI 辅助的场景,掌握高质量提示词与开发流程。

  5. MCP 与 Skill 扩展机制
    理解 MCP 协议工作流,以及如何通过 Skill 扩展 AI 的能力边界。

  6. 安全治理与 Loop Engineering
    建立 Code Review、技术债治理、智能循环工程化的长期能力。

版式建议

  • 采用 2 列布局。
  • 左边是章节编号,右边是简短说明。
  • 每章配一个小图标即可,不要太花。

第一章|AI Coding 的范式变化


03|AI 编程发展史:从补全代码到自主执行

AI 编程并不是突然出现的“魔法”,它经历了从文本生成、代码补全、工具调用,到智能体自主执行的持续演进。

发展阶段

阶段 关键词 核心特征
2022 前 基础对话时代 AI 主要进行文本问答、代码解释、语法建议,无法直接操作环境
2022 - 2023 代码生成与补全 Copilot、Codex 等工具普及,AI 开始深度参与代码编写
2023 - 2024 Function Calling / Tool Calling 模型可以通过结构化参数调用外部函数和工具,从“说”走向“做”
2024 - 至今 Agent 智能体时代 AI 能够自主规划、多轮调用工具、观察反馈并持续修正结果

核心趋势

AI 编程正在从“生成代码片段”,走向“理解目标并执行工程任务”。

讲述重点

  • 不要把 AI Coding 理解成“代码补全增强版”。
  • 真正的变化是:AI 开始具备调用工具、操作环境、闭环执行的能力。

04|普通 AI 对话 vs Agent:从远程顾问到驻场工程师

过去的 AI 更像“远程顾问”,只能基于你提供的信息给建议;而 Agent 更像“驻场工程师”,可以理解项目、执行命令、修改文件并持续调试。

对比表

维度 普通 AI 对话 Agent / Claude Code
交互方式 一问一答,被动响应 目标驱动,自主拆解任务
上下文来源 用户手动粘贴代码片段 自动读取项目结构、文件和配置
执行能力 通常只能给建议 可调用文件系统、终端、Git 等工具
调试方式 用户复制报错再反馈 自动运行、观察错误、修正方案
角色定位 场外顾问 驻场工程师

核心结论

Vibe Coding 的本质跃迁,是从“问 AI 怎么写”,变成“让 AI 协作完成目标”。

版式建议

  • 左右对比。
  • 左侧用“聊天气泡”图标,右侧用“工程师/终端”图标。
  • 中间用箭头表达迁移。

05|什么是 Vibe Coding?

Vibe Coding,也可以理解为“氛围编程”或“意图驱动编程”。开发者不再只逐行编写代码,而是通过自然语言描述需求、约束和目标,让 AI 理解上下文并协助完成实现。

核心定义

Vibe Coding = 自然语言意图 + 项目上下文 + AI 工具执行 + 人类审查把关

它改变了什么?

  • 从“我写每一行代码”变成“我定义目标与边界”。
  • 从“AI 给代码片段”变成“AI 参与完整开发流程”。
  • 从“单次问答”变成“持续迭代与反馈闭环”。
  • 从“工具辅助”变成“人机协同工程系统”。

但它不是什么?

  • 不是完全不用懂技术。
  • 不是把核心责任交给 AI。
  • 不是生成代码后直接上线。
  • 不是越复杂、越核心的场景越适合交给 AI。

讲述重点

这一页要打掉两个极端误解:

  1. AI 很强,所以人不用懂代码;
  2. AI 不可靠,所以完全不能用于开发。

正确姿势是:AI 提效,人类负责判断、审查和最终责任。


第二章|Agent 核心概念地图


06|一个生动例子:智能管家办生日派对

先不讲复杂术语。我们用一个生活化例子理解 Agent 是怎么工作的。

用户需求

“管家,帮我筹备本周末的生日派对,整体风格要温馨治愈,总预算控制在 2000 元内,邀请几位好友就行,剩下的你看着安排吧。”

管家要做什么?

  1. 理解目标
    识别主题、时间、预算、人数和偏好。

  2. 拆解任务
    找场地、买蛋糕、准备鲜花、发送邀请、控制预算。

  3. 调用服务
    查询场地、下单蛋糕、发送消息、记录回执。

  4. 处理异常
    如果场地满了,就更换方案;如果预算超了,就替换采购项。

  5. 持续反馈
    汇总进度、确认预算、输出最终安排。

映射到 AI Agent

生日派对场景 AI 技术概念
管家理解整体目标 Agent
找场地、买蛋糕、发邀请 Skill
查询档期、下单、发消息 Tool
调用某个具体接口 Function Call
场地满了重新选择 Loop
记住低糖偏好 Context / Memory
预算不超过 2000 元 Harness / Guardrails
服务统一接入标准 MCP

核心理解

Agent 不是一个单点功能,而是一个能理解目标、调度工具、处理反馈的执行系统。


07|核心关系一句话

理解 Agent 体系,可以先记住这一句话。

核心金句

Agent 用 MCP 协议,通过 Skills,调用 Tools;而这一切都建立在 Function Call 能力之上。

分层关系

Agent:负责理解目标、规划步骤、调度能力
        ↓
MCP:提供统一的工具通信协议
        ↓
Skill:封装某一类完整能力
        ↓
Tool:执行具体动作的原子工具
        ↓
Function Call:触发工具执行的结构化调用动作

一句话拆解

  • Agent 是“大脑”,负责决策。
  • MCP 是“通用语言”,负责连接。
  • Skill 是“能力包”,负责解决一类问题。
  • Tool 是“工具零件”,负责执行具体操作。
  • Function Call 是“动作指令”,负责把意图转成可执行调用。

版式建议

  • 用竖向金字塔或分层架构图。
  • Function Call 放底部,Agent 放顶部。
  • MCP 可以画成横向连接层。

08|核心名词全景图

这一页把后面会反复出现的核心名词做一次集中解释,先建立统一语言。

核心概念

名词 含义 一句话理解
Prompt 用户输入给模型的指令 告诉 AI 要做什么
Token 模型处理文本的基本单位 AI 读写文字的计量单位
Context 当前任务相关的上下文信息 AI 做判断时的背景资料
Embedding 文本向量化表示 让机器能计算语义相似度
RAG 检索增强生成 先查资料,再回答
Function Call 结构化工具调用指令 让 AI 从“说”变成“做”
Tool 最小执行单元 一个能完成具体动作的工具
Skill 一组工具和逻辑组成的能力 AI 的“专业技能包”
MCP 模型上下文协议 连接模型和外部工具的标准
Agent 智能代理 能自主规划和执行任务的系统
Loop 智能循环 思考、执行、反馈、修正的闭环
Harness 安全护栏 控制 AI 行为边界的规则系统

讲述重点

这里不用展开太深,重点是让大家之后听到这些词时不会陌生。


09|整体架构预览:AI Agent 是如何工作的?

在工程视角下,Agent 不是一个孤立模型,而是一套由模型、上下文、工具、协议和安全护栏组成的系统。

架构链路

用户自然语言需求
        ↓
Agent 智能体核心
        ↓
Context / RAG / Memory
        ↓
Loop 循环引擎
        ↓
Function Call
        ↓
MCP 协议层
        ↓
Skills / Tools
        ↓
本地环境 / 外部系统

横向安全能力

Harness 安全护栏:
权限控制 / 操作确认 / 审计日志 / 数据脱敏 / 沙箱隔离 / 人工审批

核心结论

模型只是“大脑”,真正让 AI 具备工程能力的是上下文、工具、协议、循环和安全控制。

版式建议

  • 使用一张自上而下的架构图。
  • 右侧放 Harness 安全护栏,贯穿所有层级。
  • 这页是“预告图”,后面章节逐层展开。

第三章|Claude Code 本地实践


10|Claude Code:下一代本地 AI 编程智能体

Claude Code 是 Anthropic 面向开发者推出的 AI 编程工具,核心特点是深度理解本地项目上下文,并通过终端、文件系统、Git 等能力参与真实开发流程。

核心定位

Claude Code = 本地项目上下文 + Agent 执行能力 + 工程工具链集成

关键能力

  1. 理解项目上下文
    自动读取目录结构、配置文件、源代码和依赖关系。

  2. 多文件协同修改
    能基于整体架构分析代码影响,而不是只修改单个片段。

  3. 终端与 Git 集成
    可以执行命令、查看 diff、运行测试、辅助提交。

  4. 任务驱动式开发
    用户描述目标后,AI 可以规划步骤、执行修改并持续验证。

  5. MCP 能力扩展
    可通过 MCP 接入数据库、浏览器、知识库、内部服务等工具。

注意事项

Claude Code 可以本地读取和操作项目,但数据是否出域取决于模型部署方式、企业网络策略与供应商数据政策。企业使用时需要结合安全规范进行配置。


11|Claude Code 工作流程

Claude Code 的核心价值,不是单次回答问题,而是形成一个持续的工程执行闭环。

工作流程

  1. 读取项目上下文
    扫描目录、配置文件、代码结构和依赖关系。

  2. 理解目标并制定计划
    拆解任务,确定修改路径、影响范围和验证方式。

  3. 调用工具链执行操作
    读写文件、运行命令、执行测试、查看 Git Diff。

  4. 观察结果并修正方案
    根据报错、日志、测试结果调整实现。

  5. 输出总结与验收说明
    汇总变更点、验证方法、风险点和后续建议。

流程图

读取上下文
   ↓
制定计划
   ↓
执行修改
   ↓
运行验证
   ↓
观察反馈
   ↓
继续修正 / 输出结果

核心结论

Claude Code 更像一个会使用工具的开发协作者,而不是一个单纯的代码生成器。


12|AI 为什么还需要 Git、Node 和终端?

很多人第一次使用 Claude Code 会疑惑:只是用 AI 写代码,为什么还要装 Git、Node.js、PowerShell?

答案是:因为 Agent 不是只回答问题,而是要真正操作你的本地项目。

环境依赖说明

环境 作用 为什么需要
终端 / Shell 系统操作入口 执行命令、运行脚本、安装依赖、启动服务
Git 版本控制系统 查看 diff、管理分支、回滚变更、理解提交历史
Node.js / npm JavaScript 运行时与包管理 安装 Claude Code CLI,运行部分 MCP 服务
IDE 插件 编辑器集成入口 在 VS Code 等环境中直接调用 AI 能力

核心洞察

不是 AI 让你“多装软件”,而是它要真正介入工程流程,就必须接入已有的开发工具链。


13|基础环境三件套

搭建稳定的 Claude Code 环境,优先确认终端、Git 和 Node.js 这三类基础能力。

环境要求

组件 推荐配置 说明
PowerShell / CMD Windows 推荐 PowerShell 建议管理员权限运行,避免安装和路径写入失败
Git 建议 v2.23+ 用于仓库读取、diff 对比、分支管理和回滚
Node.js 建议 v18+,优先 LTS 版本 npm 是 Claude Code CLI 和 MCP 服务的重要安装渠道
npm / npx 随 Node.js 安装 用于安装 CLI、启动 MCP 服务

常见坑

  • Node 版本过低,导致依赖安装失败。
  • Git 未加入 PATH,导致命令不可用。
  • Windows 权限不足,导致全局安装失败。
  • 国内网络访问 npm 慢,建议配置可信镜像源。

讲述重点

环境配置看似琐碎,但它决定了 Agent 能否稳定调用本地工具。


14|Claude Code 安装与验证

环境准备完成后,可以通过三步完成 Claude Code 安装与验证。

第一步:安装 CLI

npm install -g @anthropic-ai/claude-code

国内网络环境下,可以根据公司网络策略配置可信 npm 镜像源,提升安装稳定性。

第二步:验证安装

claude --version

如果终端输出版本号,说明 CLI 安装成功。

第三步:安装 IDE 插件

在 VS Code Extensions 中搜索:

Claude Code

安装后重启 VS Code,插件会自动检测本地 CLI。

常见问题排查

问题 可能原因 处理方式
claude 命令找不到 npm 全局路径未加入 PATH 检查 npm global bin 路径
安装权限失败 Windows 普通权限不足 使用管理员 PowerShell
安装超时 npm 网络访问慢 配置公司允许的镜像源
MCP 服务启动失败 Node 版本过低 升级到 LTS 版本

15|AI 编码工具路线对比

Claude Code 只是 AI Coding 的一种代表形态。当前主流工具大致可以分成四条路线。

工具路线对比

路线 代表工具 适合场景 核心特点
本地 Agent Claude Code 本地项目开发、重构、调试 深度读取项目,强调上下文和可控性
AI 原生 IDE Cursor、Trae 日常编码、前端开发、快速迭代 编辑器内集成度高,交互流畅
云端工程 Agent Devin、Codex 类工具 异步任务、脚本生成、批量开发 云端沙箱执行,适合独立任务
企业合规助手 QCode 等 金融、政企、内网开发 强调权限、审计、安全和私有化

核心判断

选择工具时不要只看“模型强不强”,还要看:

  • 是否适合当前项目类型;
  • 是否满足公司安全要求;
  • 是否能接入现有工具链;
  • 是否支持可审计、可回滚、可控执行。

第四章|AI Coding 高效使用指南


16|哪些场景最适合 AI Coding?

AI Coding 不是所有场景都适合使用。最适合 AI 的,是那些标准化、可验证、低风险、重复性强的任务。

场景分级

等级 价值判断 适合场景 使用建议
S 级 提效 5 - 10 倍 脚本编写、数据清洗、批量转换、单测生成、正则和 SQL 优先使用
A 级 提效 2 - 3 倍 CRUD、脚手架、接口样板、文档生成、框架上手 推荐使用
B 级 提效有限,需人工主导 核心业务逻辑、复杂算法、性能优化、架构草案 谨慎使用
禁用级 高风险,不建议交给 AI 自动处理 支付结算、权限鉴权、隐私数据、生产配置、核心交易链路 禁止自动执行

核心原则

越标准化、越容易验证、越低风险,越适合交给 AI。
越核心、越敏感、越不可回滚,越需要人类主导。


17|高质量提示词的 3 个万能模板

AI 输出质量很大程度取决于输入信息质量。好的提示词不是“说得长”,而是把目标、上下文、约束和验收标准讲清楚。

模板一:从零构建新功能

公式:

目标描述 + 技术栈指定 + 输入输出定义 + 约束条件 + 代码风格规范

示例:

使用 Python 的 FastAPI 框架,写一个用户注册接口。
输入是 JSON 格式的用户名和邮箱,输出是 JWT token。
要求使用 Pydantic 做数据校验,代码符合 PEP8 规范。

为什么有效:
明确技术栈、输入输出和约束,能减少 AI 自行脑补。


模板二:故障排查与调试

公式:

报错原文 + 关键代码片段 + 已尝试方案 + 预期行为

示例:

报错信息是 AttributeError: 'NoneType' object has no attribute 'id'。
代码出现在 user_service.py 第 23 行。
我已经检查过数据库连接正常。
预期行为是返回用户对象的 id,而不是 None。

为什么有效:
报错原文和已尝试方案能减少 AI 给出重复、无效建议。


模板三:重构与优化

公式:

原代码上下文 + 具体痛点 + 不可变约束 + 性能/可读性目标

示例:

这段排序算法当前时间复杂度是 O(n²),数据量大时很慢。
不能修改底层数据结构。
请重构为 O(n log n) 的实现,并添加注释说明逻辑。

为什么有效:
提前声明不可变边界,避免 AI 为了优化而破坏系统契约。


18|AI 开发全流程示例:员工生日提醒功能

假设我们给 Agent 一个目标:

“给我做一个员工生日提醒功能,明天上线。”

一个成熟的 Agent 不应该直接开始乱写代码,而是先理解、检索、规划、实现、验证和交付。

执行流程

  1. 需求确认

    • 理解提醒规则、通知时间、目标用户。
    • 检索现有需求文档或业务规范。
    • 确认是否已有类似提醒框架。
  2. 上下文检索

    • 查询数据库 Schema。
    • 搜索员工表、通知表、定时任务模块。
    • 分析现有代码结构。
  3. 编码实现

    • 新增或复用定时任务。
    • 补充生日筛选逻辑。
    • 接入通知渠道。
    • 保持现有代码风格。
  4. 测试验证

    • 构造测试数据。
    • 生成单元测试。
    • 执行本地测试命令。
    • 检查边界情况,如闰年、空生日、离职员工。
  5. 交付总结

    • 输出变更文件清单。
    • 提供验证步骤。
    • 说明潜在风险和回滚方案。

核心价值

你给的是目标,Agent 负责拆解路径;但上线前的审查、验证和责任仍然属于人。


19|通用办公场景中的 Skill 应用

AI Agent 不只用于写代码。只要通过 Skill 接入合适工具,它也可以处理大量办公自动化任务。

典型场景

场景 用户指令 所需 Skill 效率提升
文档总结 把 100 页技术方案总结成 3 页摘要,标出风险点 PDF / 文档 Skill 数小时 → 数分钟
数据分析 按部门统计本月销售数据,找出环比下降超过 20% 的项目 Excel / 数据分析 Skill 半小时 → 1 分钟
数据查询 查上个月新增注册用户,按渠道统计转化率 数据库 Skill 写 SQL → 自然语言
技术调研 对比 React 19 和 17 的差异,评估升级风险 浏览器 / 文档 Skill 人工检索 → 自动归纳
邮件整理 根据测试报告整理 Bug 修复进度并生成邮件 邮件 / 文件 Skill 手写邮件 → 自动生成

核心结论

Skill 决定了 Agent 能做什么;没有 Skill 的 AI 只能聊天,有 Skill 的 AI 才能真正干活。


第五章|MCP 与 Skill 扩展机制


20|为什么需要 MCP?

当 AI 要调用越来越多外部工具时,就会遇到一个问题:每个工具都有自己的接口、鉴权方式、参数格式和返回结构。

如果没有统一标准,Agent 每接一个工具都要单独适配,生态会非常混乱。

MCP 的作用

MCP,Model Context Protocol,是大模型连接外部工具和上下文资源的开放协议。

它解决三个核心问题:

  1. 统一工具描述
    告诉模型有哪些工具、能做什么、需要哪些参数。

  2. 统一调用方式
    让模型通过标准接口调用工具,而不是为每个工具写专用适配逻辑。

  3. 统一结果返回
    工具执行后用结构化方式把结果返回给模型,便于后续推理。

类比理解

MCP 就像 AI 工具世界里的 USB-C:
只要遵守同一套接口规范,不同工具就能被统一识别和调用。


21|MCP 协议基础:JSON-RPC 通信模型

MCP 通常基于 JSON-RPC 2.0 进行通信。它是一种轻量、结构化的远程调用协议。

三类消息

消息类型 是否有 ID 用途 示例场景
Request 发起调用,等待返回 调用某个工具
Response 返回调用结果或错误 返回查询结果、错误信息
Notification 单向通知,不等待回复 日志、状态变更、进度提示

两类常见传输方式

传输方式 适合场景 特点
STDIO 本地进程间通信 轻量、简单、无网络开销,适合本地工具
HTTP + SSE 远程服务或事件推送 适合分布式部署、多用户共享和远程能力接入

核心理解

JSON-RPC 解决“消息怎么传”,MCP 解决“模型和工具怎么协作”。


22|MCP 完整工作流程

MCP 的工作流程可以理解为:先建立连接,再发现工具,最后调用工具并返回结果。

标准流程

1. Client 发起 initialize
        ↓
2. Server 返回协议版本和能力信息
        ↓
3. Client 请求 tools/list
        ↓
4. Server 返回可用工具清单
        ↓
5. Agent 根据用户目标选择工具
        ↓
6. Client 发起 tools/call
        ↓
7. Server 执行对应工具
        ↓
8. Server 返回结构化结果
        ↓
9. Agent 判断是否继续调用或输出答案

关键角色

角色 职责
MCP Client 通常在 AI 应用侧,负责发起请求
MCP Server 封装具体工具和业务能力
Agent 根据目标决定何时调用哪个工具
Tool / Skill 执行具体任务并返回结果

核心价值

MCP 把 Agent 和工具解耦,让工具能力可以被标准化接入、组合和复用。


23|Skill:AI 的能力插件

如果说 MCP 是连接标准,那么 Skill 就是 AI 可以使用的能力包。

三个层级

层级 含义 类比
Skill 完整能力集合,能独立完成一类任务 洗衣机
Tool 组成 Skill 的原子工具 电机、进水阀、排水阀
Function Call 触发工具执行的调用动作 按下“开始”按钮

例子:数据库查询 Skill

一个数据库查询 Skill 可能包含:

  • 连接数据库 Tool;
  • 查询 Schema Tool;
  • 执行 SQL Tool;
  • 结果格式化 Tool;
  • 权限校验和脱敏逻辑。

核心理解

Skill 是能力的封装,Tool 是执行的零件,Function Call 是触发动作。


24|常见 Skill 全景图

不同类型的 Skill,决定了 Agent 可以介入哪些工作场景。

Skill 分类

类别 典型 Skill 接入方式 适用场景
开发必备类 文件读写、目录检索、Git、终端 多数内置 本地开发、调试、重构
测试调试类 单测生成、日志分析、断点辅助 半内置 / MCP 扩展 自动验证、错误定位
数据处理类 数据库查询、Excel 分析、CSV 清洗 MCP 扩展 报表、统计、数据排查
网络协作类 浏览器检索、API 调试、邮件通知 半内置 / MCP 扩展 技术调研、接口联调
企业内部类 OA、工单、监控、知识库、CI/CD 企业自研 MCP 内部流程自动化

能力标识

  • 内置能力:开箱即用,无需额外安装。
  • 半内置能力:基础功能可用,高级能力需要扩展。
  • MCP 扩展能力:需要通过 MCP Server 接入。

核心结论

企业真正的 AI 提效空间,往往来自内部系统 Skill 化。


25|Skill 生态:去哪里找?

Skill 和 MCP Server 可以来自官方示例、开源社区,也可以由企业内部自研。

获取渠道

来源 特点 建议
官方文档与示例 最可靠,适合理解标准做法 优先学习和参考
GitHub 社区项目 数量丰富,覆盖场景多 使用前检查维护状态和安全性
Awesome MCP 类资源 方便快速发现工具 适合调研,不建议直接盲用
技术社区文章 有实践经验和踩坑记录 适合作为补充材料
企业内部 Skill 市场 最贴合业务,安全可控 推荐长期建设

安全提醒

Skill 往往具备较高权限,可能涉及:

  • 文件系统读写;
  • 终端命令执行;
  • 数据库访问;
  • 内部系统操作;
  • 网络请求和外部发送。

核心原则

优先官方和可信来源;社区 Skill 必须审查;高权限 Skill 必须纳入企业治理。


26|如何制作企业自己的 Skill?

企业自研 Skill 的核心价值,是把内部系统、业务规则和工程流程封装成 AI 可调用的标准能力。

两种建设方式

方式 适合场景 特点
轻量 SDK 封装 内部脚本、查询工具、小型自动化 快速、低门槛、适合试点
完整 MCP Server 数据库、OA、监控、CI/CD、工单系统 权限细、可审计、适合规模化

企业 Skill 建设路径

  1. 先做只读能力
    查询文档、日志、知识库、工单、数据库只读视图。

  2. 再做低风险写入
    创建草稿、生成报告、提交 MR、创建工单。

  3. 最后谨慎开放高危操作
    数据修改、生产发布、审批通过、配置变更。

权限分级

等级 能力类型 示例 治理要求
L1 只读查询 查文档、查日志、查工单 基础鉴权和审计
L2 受限写入 创建草稿、提交 MR 操作记录和人工确认
L3 高危操作 改数据库、生产发布 强审批、强审计、可回滚

核心结论

企业自研 Skill 的重点不是“让 AI 什么都能做”,而是让 AI 在安全边界内做正确的事。


第六章|安全治理与 Loop Engineering


27|AI 生成代码不可直接合并:Code Review 5 条军规

AI 可以加速编码,但不能替代代码审查。尤其在企业场景中,所有 AI 生成代码都必须经过严格 Review。

五条军规

  1. 安全底线优先
    检查 SQL 注入、XSS、权限绕过、明文密钥、敏感数据泄露。

  2. 先读懂逻辑,再运行代码
    不要因为“能跑”就认为“正确”。必须理解每一处关键逻辑。

  3. 补齐边界场景
    检查空值、异常、并发、超时、重复提交、极端输入。

  4. 审计第三方依赖
    警惕 AI 引入不必要或不可信依赖,必须进行漏洞扫描。

  5. 保持性能直觉
    关注大表全量查询、多重循环、内存泄漏和核心链路性能问题。

核心原则

AI 负责提速,人类负责把关。
代码最终上线责任永远属于团队,而不是模型。


28|技术债与长期风险

AI 写代码很快,但“生成速度”不等于“维护质量”。如果缺乏治理,AI 可能会加速技术债累积。

主要风险

  1. 理解债务
    AI 生成的代码超过团队阅读和理解速度,导致“今天能跑,明天不敢改”。

  2. 架构腐化
    多轮生成后随意新增文件、重复造轮子、层级混乱,破坏系统边界。

  3. 依赖膨胀
    为了快速实现功能引入大量第三方包,增加安全和维护成本。

  4. 能力退化
    团队长期只会“提需求”,底层排错、算法设计、架构判断能力下降。

  5. 责任模糊
    “这是 AI 写的”不能成为质量问题的借口。

应对策略

  • 先设计文档,再让 AI 编码。
  • 核心逻辑由人主导,AI 辅助实现。
  • 定期重构和技术复盘。
  • 所有 AI 代码必须 Review。
  • 建立项目级 AI 使用规范。

核心提醒

技术债是隐性的复利成本。AI 能提升短期速度,也可能放大长期维护压力。


29|从 Prompt Engineering 到 Loop Engineering

早期我们关注的是 Prompt Engineering:如何写好一个提示词,让模型给出一次更好的回答。

但在 Agent 时代,真正重要的是 Loop Engineering:如何设计一个能持续执行、反馈、修正和终止的任务循环。

范式演进

阶段 关注点 解决的问题
Prompt 单次输入质量 怎么问,AI 才答得好
Context 上下文管理 AI 如何理解背景和历史
RAG 外部知识检索 AI 如何减少幻觉
Harness 安全护栏 AI 什么能做,什么不能做
Loop 闭环执行 AI 如何持续推进任务
Deployment 工程落地 AI 如何稳定进入生产流程

核心区别

  • Prompt Engineering 关注单次回答质量。
  • Loop Engineering 关注任务完成过程。

核心结论

Agent 的能力上限,不只取决于模型,也取决于循环设计、工具质量和终止条件。


30|Loop Engineering 五要素

一个可靠的智能循环,不是让 Agent 无限尝试,而是让它在明确目标、工具、上下文和边界下持续迭代。

五个关键要素

要素 说明 开发场景示例
明确目标与完成定义 定义什么叫任务完成 单测通过、功能可验收、无新增错误
构建高效工具箱 提供必要执行能力 文件检索、终端、Git、日志、数据库
上下文管理 保留关键资料和历史决策 CLAUDE.md、需求文档、错误日志
终止判定条件 防止无限循环 成功退出、失败退出、转人工处理
错误处理与策略迭代 从失败中调整路径 捕获报错、重试、回滚、记录经验

示例:修复一个线上 Bug

目标:错误日志消失,相关单测通过
工具:日志查询、代码检索、测试命令、Git diff
上下文:错误栈、用户输入、历史提交
终止:测试通过并完成人工 Review
失败处理:回滚修改,记录原因,转人工分析

核心结论

Loop 的目标不是让 AI 一直动,而是让 AI 在可控边界内逐步接近正确结果。


31|最终架构总结

到这里,我们可以把整套 Vibe Coding 技术体系串起来。

完整链路

用户自然语言需求
        ↓
Agent 智能体
负责理解目标、拆解任务、规划步骤
        ↓
Context / RAG / Memory
提供项目背景、知识检索和历史记忆
        ↓
Loop Engine
持续执行、观察、反馈和修正
        ↓
Function Call
生成结构化工具调用指令
        ↓
MCP / JSON-RPC
标准化连接外部工具和上下文资源
        ↓
Skills
封装可复用的专业能力
        ↓
Tools
执行文件读写、终端命令、数据库查询、API 调用
        ↓
运行环境
Git / Node.js / Shell / IDE / 文件系统 / 内部服务

横向治理能力

Harness 安全护栏贯穿全链路:
权限控制、数据脱敏、人工确认、审计日志、限流熔断、沙箱隔离、回滚机制

核心金句回顾

Function Call 让 AI 能调用工具;
MCP 让工具能标准化接入;
Skill 让能力能复用组合;
Agent 让任务能自主执行;
Loop 让结果能持续逼近目标;
Harness 让整个过程安全可控。


32|落地建议:公司内部如何使用 AI Coding?

最后给出一套适合团队落地的实践建议。

使用原则

  1. 先低风险,后高价值
    从脚本、测试、文档、查询、重构辅助等场景开始。

  2. 先只读,后写入
    企业 Skill 建设优先接入知识库、日志、工单等只读能力。

  3. 先人审,后自动化
    所有代码修改、数据库写入、生产发布都必须有人类确认。

  4. 先规范,后规模化
    建立 AI 使用规范、Prompt 模板、Review 清单和审计机制。

  5. 先沉淀,再复用
    把高频任务沉淀为内部 Skill 和标准工作流。

推荐落地路径

阶段 1:个人效率提升
脚本、SQL、单测、文档、代码解释

阶段 2:团队协作增强
统一提示词模板、代码审查规范、AI 辅助需求分析

阶段 3:内部 Skill 建设
知识库、日志、工单、数据库只读查询

阶段 4:Agent 工作流
在权限和审计约束下实现多步骤自动化

阶段 5:企业级治理
统一权限、审计、监控、脱敏、回滚和安全策略

最终结论

AI Coding 的目标不是替代工程师,而是把工程师从重复劳动中释放出来,让人更专注于判断、设计、审查和创新。


33|结束页

从“会聊天的 AI”到“能协作的工程伙伴”

AI 编程的真正价值,不在于它能一次生成多少代码,而在于它能否在安全、可控、可审查的边界内,持续帮助团队完成真实工程任务。

关键 Takeaways

  • Function Call 是行动能力的起点。
  • MCP 是工具接入的标准桥梁。
  • Skill 是企业能力复用的关键资产。
  • Agent 是目标驱动的任务执行主体。
  • Loop Engineering 是复杂任务稳定落地的方法论。
  • 安全治理 是 AI Coding 进入企业生产流程的前提。

收尾金句

让 AI 写代码只是开始;
让 AI 安全、稳定、可控地参与工程流程,才是 Vibe Coding 的真正终点。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐