最好的VibeCoding宣讲材料
先建立认知:AI 编程为什么从“对话”走向“行动”;
再讲清底层:Function Call、MCP、Skill、Agent 如何协作;
然后落地实践:Claude Code 怎么装、怎么用、适合哪些场景;
最后收束到工程化:Code Review、技术债、Loop Engineering 与安全治理。
《Vibe Coding 技术分享》新版 PPT
从 Function Call 到 Agent 的完整演进之路
INTERNAL TECHNICAL SHARING · 内部技术分享
01|封面页
Vibe Coding 技术分享
从 Function Call 到 Agent 的完整演进之路
副标题:
让 AI 从“会回答问题”进化为“能执行任务”的工程化方法
页脚:
Internal Technical Sharing · 内部技术分享
版式建议
- 背景可以使用深色科技风。
- 中间放一条演进链路:
Prompt → Function Call → Tool → Skill → MCP → Agent → Loop
02|目录
这次分享会从认知、工具、协议、实践和治理五个层次展开,帮助大家建立一套完整的 AI Coding 技术地图。
目录
-
AI Coding 的范式变化
从对话 AI 到行动 AI,理解 AI 编程为什么正在发生质变。 -
Agent 核心概念地图
梳理 Function Call、Tool、Skill、MCP、Agent、Loop 之间的关系。 -
Claude Code 本地实践
介绍 Claude Code 的定位、工作流程、环境安装和典型使用方式。 -
AI Coding 高效使用指南
识别适合 AI 辅助的场景,掌握高质量提示词与开发流程。 -
MCP 与 Skill 扩展机制
理解 MCP 协议工作流,以及如何通过 Skill 扩展 AI 的能力边界。 -
安全治理与 Loop Engineering
建立 Code Review、技术债治理、智能循环工程化的长期能力。
版式建议
- 采用 2 列布局。
- 左边是章节编号,右边是简短说明。
- 每章配一个小图标即可,不要太花。
第一章|AI Coding 的范式变化
03|AI 编程发展史:从补全代码到自主执行
AI 编程并不是突然出现的“魔法”,它经历了从文本生成、代码补全、工具调用,到智能体自主执行的持续演进。
发展阶段
| 阶段 | 关键词 | 核心特征 |
|---|---|---|
| 2022 前 | 基础对话时代 | AI 主要进行文本问答、代码解释、语法建议,无法直接操作环境 |
| 2022 - 2023 | 代码生成与补全 | Copilot、Codex 等工具普及,AI 开始深度参与代码编写 |
| 2023 - 2024 | Function Calling / Tool Calling | 模型可以通过结构化参数调用外部函数和工具,从“说”走向“做” |
| 2024 - 至今 | Agent 智能体时代 | AI 能够自主规划、多轮调用工具、观察反馈并持续修正结果 |
核心趋势
AI 编程正在从“生成代码片段”,走向“理解目标并执行工程任务”。
讲述重点
- 不要把 AI Coding 理解成“代码补全增强版”。
- 真正的变化是:AI 开始具备调用工具、操作环境、闭环执行的能力。
04|普通 AI 对话 vs Agent:从远程顾问到驻场工程师
过去的 AI 更像“远程顾问”,只能基于你提供的信息给建议;而 Agent 更像“驻场工程师”,可以理解项目、执行命令、修改文件并持续调试。
对比表
| 维度 | 普通 AI 对话 | Agent / Claude Code |
|---|---|---|
| 交互方式 | 一问一答,被动响应 | 目标驱动,自主拆解任务 |
| 上下文来源 | 用户手动粘贴代码片段 | 自动读取项目结构、文件和配置 |
| 执行能力 | 通常只能给建议 | 可调用文件系统、终端、Git 等工具 |
| 调试方式 | 用户复制报错再反馈 | 自动运行、观察错误、修正方案 |
| 角色定位 | 场外顾问 | 驻场工程师 |
核心结论
Vibe Coding 的本质跃迁,是从“问 AI 怎么写”,变成“让 AI 协作完成目标”。
版式建议
- 左右对比。
- 左侧用“聊天气泡”图标,右侧用“工程师/终端”图标。
- 中间用箭头表达迁移。
05|什么是 Vibe Coding?
Vibe Coding,也可以理解为“氛围编程”或“意图驱动编程”。开发者不再只逐行编写代码,而是通过自然语言描述需求、约束和目标,让 AI 理解上下文并协助完成实现。
核心定义
Vibe Coding = 自然语言意图 + 项目上下文 + AI 工具执行 + 人类审查把关
它改变了什么?
- 从“我写每一行代码”变成“我定义目标与边界”。
- 从“AI 给代码片段”变成“AI 参与完整开发流程”。
- 从“单次问答”变成“持续迭代与反馈闭环”。
- 从“工具辅助”变成“人机协同工程系统”。
但它不是什么?
- 不是完全不用懂技术。
- 不是把核心责任交给 AI。
- 不是生成代码后直接上线。
- 不是越复杂、越核心的场景越适合交给 AI。
讲述重点
这一页要打掉两个极端误解:
- AI 很强,所以人不用懂代码;
- AI 不可靠,所以完全不能用于开发。
正确姿势是:AI 提效,人类负责判断、审查和最终责任。
第二章|Agent 核心概念地图
06|一个生动例子:智能管家办生日派对
先不讲复杂术语。我们用一个生活化例子理解 Agent 是怎么工作的。
用户需求
“管家,帮我筹备本周末的生日派对,整体风格要温馨治愈,总预算控制在 2000 元内,邀请几位好友就行,剩下的你看着安排吧。”
管家要做什么?
-
理解目标
识别主题、时间、预算、人数和偏好。 -
拆解任务
找场地、买蛋糕、准备鲜花、发送邀请、控制预算。 -
调用服务
查询场地、下单蛋糕、发送消息、记录回执。 -
处理异常
如果场地满了,就更换方案;如果预算超了,就替换采购项。 -
持续反馈
汇总进度、确认预算、输出最终安排。
映射到 AI Agent
| 生日派对场景 | AI 技术概念 |
|---|---|
| 管家理解整体目标 | Agent |
| 找场地、买蛋糕、发邀请 | Skill |
| 查询档期、下单、发消息 | Tool |
| 调用某个具体接口 | Function Call |
| 场地满了重新选择 | Loop |
| 记住低糖偏好 | Context / Memory |
| 预算不超过 2000 元 | Harness / Guardrails |
| 服务统一接入标准 | MCP |
核心理解
Agent 不是一个单点功能,而是一个能理解目标、调度工具、处理反馈的执行系统。
07|核心关系一句话
理解 Agent 体系,可以先记住这一句话。
核心金句
Agent 用 MCP 协议,通过 Skills,调用 Tools;而这一切都建立在 Function Call 能力之上。
分层关系
Agent:负责理解目标、规划步骤、调度能力
↓
MCP:提供统一的工具通信协议
↓
Skill:封装某一类完整能力
↓
Tool:执行具体动作的原子工具
↓
Function Call:触发工具执行的结构化调用动作
一句话拆解
- Agent 是“大脑”,负责决策。
- MCP 是“通用语言”,负责连接。
- Skill 是“能力包”,负责解决一类问题。
- Tool 是“工具零件”,负责执行具体操作。
- Function Call 是“动作指令”,负责把意图转成可执行调用。
版式建议
- 用竖向金字塔或分层架构图。
- Function Call 放底部,Agent 放顶部。
- MCP 可以画成横向连接层。
08|核心名词全景图
这一页把后面会反复出现的核心名词做一次集中解释,先建立统一语言。
核心概念
| 名词 | 含义 | 一句话理解 |
|---|---|---|
| Prompt | 用户输入给模型的指令 | 告诉 AI 要做什么 |
| Token | 模型处理文本的基本单位 | AI 读写文字的计量单位 |
| Context | 当前任务相关的上下文信息 | AI 做判断时的背景资料 |
| Embedding | 文本向量化表示 | 让机器能计算语义相似度 |
| RAG | 检索增强生成 | 先查资料,再回答 |
| Function Call | 结构化工具调用指令 | 让 AI 从“说”变成“做” |
| Tool | 最小执行单元 | 一个能完成具体动作的工具 |
| Skill | 一组工具和逻辑组成的能力 | AI 的“专业技能包” |
| MCP | 模型上下文协议 | 连接模型和外部工具的标准 |
| Agent | 智能代理 | 能自主规划和执行任务的系统 |
| Loop | 智能循环 | 思考、执行、反馈、修正的闭环 |
| Harness | 安全护栏 | 控制 AI 行为边界的规则系统 |
讲述重点
这里不用展开太深,重点是让大家之后听到这些词时不会陌生。
09|整体架构预览:AI Agent 是如何工作的?
在工程视角下,Agent 不是一个孤立模型,而是一套由模型、上下文、工具、协议和安全护栏组成的系统。
架构链路
用户自然语言需求
↓
Agent 智能体核心
↓
Context / RAG / Memory
↓
Loop 循环引擎
↓
Function Call
↓
MCP 协议层
↓
Skills / Tools
↓
本地环境 / 外部系统
横向安全能力
Harness 安全护栏:
权限控制 / 操作确认 / 审计日志 / 数据脱敏 / 沙箱隔离 / 人工审批
核心结论
模型只是“大脑”,真正让 AI 具备工程能力的是上下文、工具、协议、循环和安全控制。
版式建议
- 使用一张自上而下的架构图。
- 右侧放 Harness 安全护栏,贯穿所有层级。
- 这页是“预告图”,后面章节逐层展开。
第三章|Claude Code 本地实践
10|Claude Code:下一代本地 AI 编程智能体
Claude Code 是 Anthropic 面向开发者推出的 AI 编程工具,核心特点是深度理解本地项目上下文,并通过终端、文件系统、Git 等能力参与真实开发流程。
核心定位
Claude Code = 本地项目上下文 + Agent 执行能力 + 工程工具链集成
关键能力
-
理解项目上下文
自动读取目录结构、配置文件、源代码和依赖关系。 -
多文件协同修改
能基于整体架构分析代码影响,而不是只修改单个片段。 -
终端与 Git 集成
可以执行命令、查看 diff、运行测试、辅助提交。 -
任务驱动式开发
用户描述目标后,AI 可以规划步骤、执行修改并持续验证。 -
MCP 能力扩展
可通过 MCP 接入数据库、浏览器、知识库、内部服务等工具。
注意事项
Claude Code 可以本地读取和操作项目,但数据是否出域取决于模型部署方式、企业网络策略与供应商数据政策。企业使用时需要结合安全规范进行配置。
11|Claude Code 工作流程
Claude Code 的核心价值,不是单次回答问题,而是形成一个持续的工程执行闭环。
工作流程
-
读取项目上下文
扫描目录、配置文件、代码结构和依赖关系。 -
理解目标并制定计划
拆解任务,确定修改路径、影响范围和验证方式。 -
调用工具链执行操作
读写文件、运行命令、执行测试、查看 Git Diff。 -
观察结果并修正方案
根据报错、日志、测试结果调整实现。 -
输出总结与验收说明
汇总变更点、验证方法、风险点和后续建议。
流程图
读取上下文
↓
制定计划
↓
执行修改
↓
运行验证
↓
观察反馈
↓
继续修正 / 输出结果
核心结论
Claude Code 更像一个会使用工具的开发协作者,而不是一个单纯的代码生成器。
12|AI 为什么还需要 Git、Node 和终端?
很多人第一次使用 Claude Code 会疑惑:只是用 AI 写代码,为什么还要装 Git、Node.js、PowerShell?
答案是:因为 Agent 不是只回答问题,而是要真正操作你的本地项目。
环境依赖说明
| 环境 | 作用 | 为什么需要 |
|---|---|---|
| 终端 / Shell | 系统操作入口 | 执行命令、运行脚本、安装依赖、启动服务 |
| Git | 版本控制系统 | 查看 diff、管理分支、回滚变更、理解提交历史 |
| Node.js / npm | JavaScript 运行时与包管理 | 安装 Claude Code CLI,运行部分 MCP 服务 |
| IDE 插件 | 编辑器集成入口 | 在 VS Code 等环境中直接调用 AI 能力 |
核心洞察
不是 AI 让你“多装软件”,而是它要真正介入工程流程,就必须接入已有的开发工具链。
13|基础环境三件套
搭建稳定的 Claude Code 环境,优先确认终端、Git 和 Node.js 这三类基础能力。
环境要求
| 组件 | 推荐配置 | 说明 |
|---|---|---|
| PowerShell / CMD | Windows 推荐 PowerShell | 建议管理员权限运行,避免安装和路径写入失败 |
| Git | 建议 v2.23+ | 用于仓库读取、diff 对比、分支管理和回滚 |
| Node.js | 建议 v18+,优先 LTS 版本 | npm 是 Claude Code CLI 和 MCP 服务的重要安装渠道 |
| npm / npx | 随 Node.js 安装 | 用于安装 CLI、启动 MCP 服务 |
常见坑
- Node 版本过低,导致依赖安装失败。
- Git 未加入 PATH,导致命令不可用。
- Windows 权限不足,导致全局安装失败。
- 国内网络访问 npm 慢,建议配置可信镜像源。
讲述重点
环境配置看似琐碎,但它决定了 Agent 能否稳定调用本地工具。
14|Claude Code 安装与验证
环境准备完成后,可以通过三步完成 Claude Code 安装与验证。
第一步:安装 CLI
npm install -g @anthropic-ai/claude-code
国内网络环境下,可以根据公司网络策略配置可信 npm 镜像源,提升安装稳定性。
第二步:验证安装
claude --version
如果终端输出版本号,说明 CLI 安装成功。
第三步:安装 IDE 插件
在 VS Code Extensions 中搜索:
Claude Code
安装后重启 VS Code,插件会自动检测本地 CLI。
常见问题排查
| 问题 | 可能原因 | 处理方式 |
|---|---|---|
| claude 命令找不到 | npm 全局路径未加入 PATH | 检查 npm global bin 路径 |
| 安装权限失败 | Windows 普通权限不足 | 使用管理员 PowerShell |
| 安装超时 | npm 网络访问慢 | 配置公司允许的镜像源 |
| MCP 服务启动失败 | Node 版本过低 | 升级到 LTS 版本 |
15|AI 编码工具路线对比
Claude Code 只是 AI Coding 的一种代表形态。当前主流工具大致可以分成四条路线。
工具路线对比
| 路线 | 代表工具 | 适合场景 | 核心特点 |
|---|---|---|---|
| 本地 Agent | Claude Code | 本地项目开发、重构、调试 | 深度读取项目,强调上下文和可控性 |
| AI 原生 IDE | Cursor、Trae | 日常编码、前端开发、快速迭代 | 编辑器内集成度高,交互流畅 |
| 云端工程 Agent | Devin、Codex 类工具 | 异步任务、脚本生成、批量开发 | 云端沙箱执行,适合独立任务 |
| 企业合规助手 | QCode 等 | 金融、政企、内网开发 | 强调权限、审计、安全和私有化 |
核心判断
选择工具时不要只看“模型强不强”,还要看:
- 是否适合当前项目类型;
- 是否满足公司安全要求;
- 是否能接入现有工具链;
- 是否支持可审计、可回滚、可控执行。
第四章|AI Coding 高效使用指南
16|哪些场景最适合 AI Coding?
AI Coding 不是所有场景都适合使用。最适合 AI 的,是那些标准化、可验证、低风险、重复性强的任务。
场景分级
| 等级 | 价值判断 | 适合场景 | 使用建议 |
|---|---|---|---|
| S 级 | 提效 5 - 10 倍 | 脚本编写、数据清洗、批量转换、单测生成、正则和 SQL | 优先使用 |
| A 级 | 提效 2 - 3 倍 | CRUD、脚手架、接口样板、文档生成、框架上手 | 推荐使用 |
| B 级 | 提效有限,需人工主导 | 核心业务逻辑、复杂算法、性能优化、架构草案 | 谨慎使用 |
| 禁用级 | 高风险,不建议交给 AI 自动处理 | 支付结算、权限鉴权、隐私数据、生产配置、核心交易链路 | 禁止自动执行 |
核心原则
越标准化、越容易验证、越低风险,越适合交给 AI。
越核心、越敏感、越不可回滚,越需要人类主导。
17|高质量提示词的 3 个万能模板
AI 输出质量很大程度取决于输入信息质量。好的提示词不是“说得长”,而是把目标、上下文、约束和验收标准讲清楚。
模板一:从零构建新功能
公式:
目标描述 + 技术栈指定 + 输入输出定义 + 约束条件 + 代码风格规范
示例:
使用 Python 的 FastAPI 框架,写一个用户注册接口。
输入是 JSON 格式的用户名和邮箱,输出是 JWT token。
要求使用 Pydantic 做数据校验,代码符合 PEP8 规范。
为什么有效:
明确技术栈、输入输出和约束,能减少 AI 自行脑补。
模板二:故障排查与调试
公式:
报错原文 + 关键代码片段 + 已尝试方案 + 预期行为
示例:
报错信息是 AttributeError: 'NoneType' object has no attribute 'id'。
代码出现在 user_service.py 第 23 行。
我已经检查过数据库连接正常。
预期行为是返回用户对象的 id,而不是 None。
为什么有效:
报错原文和已尝试方案能减少 AI 给出重复、无效建议。
模板三:重构与优化
公式:
原代码上下文 + 具体痛点 + 不可变约束 + 性能/可读性目标
示例:
这段排序算法当前时间复杂度是 O(n²),数据量大时很慢。
不能修改底层数据结构。
请重构为 O(n log n) 的实现,并添加注释说明逻辑。
为什么有效:
提前声明不可变边界,避免 AI 为了优化而破坏系统契约。
18|AI 开发全流程示例:员工生日提醒功能
假设我们给 Agent 一个目标:
“给我做一个员工生日提醒功能,明天上线。”
一个成熟的 Agent 不应该直接开始乱写代码,而是先理解、检索、规划、实现、验证和交付。
执行流程
-
需求确认
- 理解提醒规则、通知时间、目标用户。
- 检索现有需求文档或业务规范。
- 确认是否已有类似提醒框架。
-
上下文检索
- 查询数据库 Schema。
- 搜索员工表、通知表、定时任务模块。
- 分析现有代码结构。
-
编码实现
- 新增或复用定时任务。
- 补充生日筛选逻辑。
- 接入通知渠道。
- 保持现有代码风格。
-
测试验证
- 构造测试数据。
- 生成单元测试。
- 执行本地测试命令。
- 检查边界情况,如闰年、空生日、离职员工。
-
交付总结
- 输出变更文件清单。
- 提供验证步骤。
- 说明潜在风险和回滚方案。
核心价值
你给的是目标,Agent 负责拆解路径;但上线前的审查、验证和责任仍然属于人。
19|通用办公场景中的 Skill 应用
AI Agent 不只用于写代码。只要通过 Skill 接入合适工具,它也可以处理大量办公自动化任务。
典型场景
| 场景 | 用户指令 | 所需 Skill | 效率提升 |
|---|---|---|---|
| 文档总结 | 把 100 页技术方案总结成 3 页摘要,标出风险点 | PDF / 文档 Skill | 数小时 → 数分钟 |
| 数据分析 | 按部门统计本月销售数据,找出环比下降超过 20% 的项目 | Excel / 数据分析 Skill | 半小时 → 1 分钟 |
| 数据查询 | 查上个月新增注册用户,按渠道统计转化率 | 数据库 Skill | 写 SQL → 自然语言 |
| 技术调研 | 对比 React 19 和 17 的差异,评估升级风险 | 浏览器 / 文档 Skill | 人工检索 → 自动归纳 |
| 邮件整理 | 根据测试报告整理 Bug 修复进度并生成邮件 | 邮件 / 文件 Skill | 手写邮件 → 自动生成 |
核心结论
Skill 决定了 Agent 能做什么;没有 Skill 的 AI 只能聊天,有 Skill 的 AI 才能真正干活。
第五章|MCP 与 Skill 扩展机制
20|为什么需要 MCP?
当 AI 要调用越来越多外部工具时,就会遇到一个问题:每个工具都有自己的接口、鉴权方式、参数格式和返回结构。
如果没有统一标准,Agent 每接一个工具都要单独适配,生态会非常混乱。
MCP 的作用
MCP,Model Context Protocol,是大模型连接外部工具和上下文资源的开放协议。
它解决三个核心问题:
-
统一工具描述
告诉模型有哪些工具、能做什么、需要哪些参数。 -
统一调用方式
让模型通过标准接口调用工具,而不是为每个工具写专用适配逻辑。 -
统一结果返回
工具执行后用结构化方式把结果返回给模型,便于后续推理。
类比理解
MCP 就像 AI 工具世界里的 USB-C:
只要遵守同一套接口规范,不同工具就能被统一识别和调用。
21|MCP 协议基础:JSON-RPC 通信模型
MCP 通常基于 JSON-RPC 2.0 进行通信。它是一种轻量、结构化的远程调用协议。
三类消息
| 消息类型 | 是否有 ID | 用途 | 示例场景 |
|---|---|---|---|
| Request | 有 | 发起调用,等待返回 | 调用某个工具 |
| Response | 有 | 返回调用结果或错误 | 返回查询结果、错误信息 |
| Notification | 无 | 单向通知,不等待回复 | 日志、状态变更、进度提示 |
两类常见传输方式
| 传输方式 | 适合场景 | 特点 |
|---|---|---|
| STDIO | 本地进程间通信 | 轻量、简单、无网络开销,适合本地工具 |
| HTTP + SSE | 远程服务或事件推送 | 适合分布式部署、多用户共享和远程能力接入 |
核心理解
JSON-RPC 解决“消息怎么传”,MCP 解决“模型和工具怎么协作”。
22|MCP 完整工作流程
MCP 的工作流程可以理解为:先建立连接,再发现工具,最后调用工具并返回结果。
标准流程
1. Client 发起 initialize
↓
2. Server 返回协议版本和能力信息
↓
3. Client 请求 tools/list
↓
4. Server 返回可用工具清单
↓
5. Agent 根据用户目标选择工具
↓
6. Client 发起 tools/call
↓
7. Server 执行对应工具
↓
8. Server 返回结构化结果
↓
9. Agent 判断是否继续调用或输出答案
关键角色
| 角色 | 职责 |
|---|---|
| MCP Client | 通常在 AI 应用侧,负责发起请求 |
| MCP Server | 封装具体工具和业务能力 |
| Agent | 根据目标决定何时调用哪个工具 |
| Tool / Skill | 执行具体任务并返回结果 |
核心价值
MCP 把 Agent 和工具解耦,让工具能力可以被标准化接入、组合和复用。
23|Skill:AI 的能力插件
如果说 MCP 是连接标准,那么 Skill 就是 AI 可以使用的能力包。
三个层级
| 层级 | 含义 | 类比 |
|---|---|---|
| Skill | 完整能力集合,能独立完成一类任务 | 洗衣机 |
| Tool | 组成 Skill 的原子工具 | 电机、进水阀、排水阀 |
| Function Call | 触发工具执行的调用动作 | 按下“开始”按钮 |
例子:数据库查询 Skill
一个数据库查询 Skill 可能包含:
- 连接数据库 Tool;
- 查询 Schema Tool;
- 执行 SQL Tool;
- 结果格式化 Tool;
- 权限校验和脱敏逻辑。
核心理解
Skill 是能力的封装,Tool 是执行的零件,Function Call 是触发动作。
24|常见 Skill 全景图
不同类型的 Skill,决定了 Agent 可以介入哪些工作场景。
Skill 分类
| 类别 | 典型 Skill | 接入方式 | 适用场景 |
|---|---|---|---|
| 开发必备类 | 文件读写、目录检索、Git、终端 | 多数内置 | 本地开发、调试、重构 |
| 测试调试类 | 单测生成、日志分析、断点辅助 | 半内置 / MCP 扩展 | 自动验证、错误定位 |
| 数据处理类 | 数据库查询、Excel 分析、CSV 清洗 | MCP 扩展 | 报表、统计、数据排查 |
| 网络协作类 | 浏览器检索、API 调试、邮件通知 | 半内置 / MCP 扩展 | 技术调研、接口联调 |
| 企业内部类 | OA、工单、监控、知识库、CI/CD | 企业自研 MCP | 内部流程自动化 |
能力标识
- 内置能力:开箱即用,无需额外安装。
- 半内置能力:基础功能可用,高级能力需要扩展。
- MCP 扩展能力:需要通过 MCP Server 接入。
核心结论
企业真正的 AI 提效空间,往往来自内部系统 Skill 化。
25|Skill 生态:去哪里找?
Skill 和 MCP Server 可以来自官方示例、开源社区,也可以由企业内部自研。
获取渠道
| 来源 | 特点 | 建议 |
|---|---|---|
| 官方文档与示例 | 最可靠,适合理解标准做法 | 优先学习和参考 |
| GitHub 社区项目 | 数量丰富,覆盖场景多 | 使用前检查维护状态和安全性 |
| Awesome MCP 类资源 | 方便快速发现工具 | 适合调研,不建议直接盲用 |
| 技术社区文章 | 有实践经验和踩坑记录 | 适合作为补充材料 |
| 企业内部 Skill 市场 | 最贴合业务,安全可控 | 推荐长期建设 |
安全提醒
Skill 往往具备较高权限,可能涉及:
- 文件系统读写;
- 终端命令执行;
- 数据库访问;
- 内部系统操作;
- 网络请求和外部发送。
核心原则
优先官方和可信来源;社区 Skill 必须审查;高权限 Skill 必须纳入企业治理。
26|如何制作企业自己的 Skill?
企业自研 Skill 的核心价值,是把内部系统、业务规则和工程流程封装成 AI 可调用的标准能力。
两种建设方式
| 方式 | 适合场景 | 特点 |
|---|---|---|
| 轻量 SDK 封装 | 内部脚本、查询工具、小型自动化 | 快速、低门槛、适合试点 |
| 完整 MCP Server | 数据库、OA、监控、CI/CD、工单系统 | 权限细、可审计、适合规模化 |
企业 Skill 建设路径
-
先做只读能力
查询文档、日志、知识库、工单、数据库只读视图。 -
再做低风险写入
创建草稿、生成报告、提交 MR、创建工单。 -
最后谨慎开放高危操作
数据修改、生产发布、审批通过、配置变更。
权限分级
| 等级 | 能力类型 | 示例 | 治理要求 |
|---|---|---|---|
| L1 | 只读查询 | 查文档、查日志、查工单 | 基础鉴权和审计 |
| L2 | 受限写入 | 创建草稿、提交 MR | 操作记录和人工确认 |
| L3 | 高危操作 | 改数据库、生产发布 | 强审批、强审计、可回滚 |
核心结论
企业自研 Skill 的重点不是“让 AI 什么都能做”,而是让 AI 在安全边界内做正确的事。
第六章|安全治理与 Loop Engineering
27|AI 生成代码不可直接合并:Code Review 5 条军规
AI 可以加速编码,但不能替代代码审查。尤其在企业场景中,所有 AI 生成代码都必须经过严格 Review。
五条军规
-
安全底线优先
检查 SQL 注入、XSS、权限绕过、明文密钥、敏感数据泄露。 -
先读懂逻辑,再运行代码
不要因为“能跑”就认为“正确”。必须理解每一处关键逻辑。 -
补齐边界场景
检查空值、异常、并发、超时、重复提交、极端输入。 -
审计第三方依赖
警惕 AI 引入不必要或不可信依赖,必须进行漏洞扫描。 -
保持性能直觉
关注大表全量查询、多重循环、内存泄漏和核心链路性能问题。
核心原则
AI 负责提速,人类负责把关。
代码最终上线责任永远属于团队,而不是模型。
28|技术债与长期风险
AI 写代码很快,但“生成速度”不等于“维护质量”。如果缺乏治理,AI 可能会加速技术债累积。
主要风险
-
理解债务
AI 生成的代码超过团队阅读和理解速度,导致“今天能跑,明天不敢改”。 -
架构腐化
多轮生成后随意新增文件、重复造轮子、层级混乱,破坏系统边界。 -
依赖膨胀
为了快速实现功能引入大量第三方包,增加安全和维护成本。 -
能力退化
团队长期只会“提需求”,底层排错、算法设计、架构判断能力下降。 -
责任模糊
“这是 AI 写的”不能成为质量问题的借口。
应对策略
- 先设计文档,再让 AI 编码。
- 核心逻辑由人主导,AI 辅助实现。
- 定期重构和技术复盘。
- 所有 AI 代码必须 Review。
- 建立项目级 AI 使用规范。
核心提醒
技术债是隐性的复利成本。AI 能提升短期速度,也可能放大长期维护压力。
29|从 Prompt Engineering 到 Loop Engineering
早期我们关注的是 Prompt Engineering:如何写好一个提示词,让模型给出一次更好的回答。
但在 Agent 时代,真正重要的是 Loop Engineering:如何设计一个能持续执行、反馈、修正和终止的任务循环。
范式演进
| 阶段 | 关注点 | 解决的问题 |
|---|---|---|
| Prompt | 单次输入质量 | 怎么问,AI 才答得好 |
| Context | 上下文管理 | AI 如何理解背景和历史 |
| RAG | 外部知识检索 | AI 如何减少幻觉 |
| Harness | 安全护栏 | AI 什么能做,什么不能做 |
| Loop | 闭环执行 | AI 如何持续推进任务 |
| Deployment | 工程落地 | AI 如何稳定进入生产流程 |
核心区别
- Prompt Engineering 关注单次回答质量。
- Loop Engineering 关注任务完成过程。
核心结论
Agent 的能力上限,不只取决于模型,也取决于循环设计、工具质量和终止条件。
30|Loop Engineering 五要素
一个可靠的智能循环,不是让 Agent 无限尝试,而是让它在明确目标、工具、上下文和边界下持续迭代。
五个关键要素
| 要素 | 说明 | 开发场景示例 |
|---|---|---|
| 明确目标与完成定义 | 定义什么叫任务完成 | 单测通过、功能可验收、无新增错误 |
| 构建高效工具箱 | 提供必要执行能力 | 文件检索、终端、Git、日志、数据库 |
| 上下文管理 | 保留关键资料和历史决策 | CLAUDE.md、需求文档、错误日志 |
| 终止判定条件 | 防止无限循环 | 成功退出、失败退出、转人工处理 |
| 错误处理与策略迭代 | 从失败中调整路径 | 捕获报错、重试、回滚、记录经验 |
示例:修复一个线上 Bug
目标:错误日志消失,相关单测通过
工具:日志查询、代码检索、测试命令、Git diff
上下文:错误栈、用户输入、历史提交
终止:测试通过并完成人工 Review
失败处理:回滚修改,记录原因,转人工分析
核心结论
Loop 的目标不是让 AI 一直动,而是让 AI 在可控边界内逐步接近正确结果。
31|最终架构总结
到这里,我们可以把整套 Vibe Coding 技术体系串起来。
完整链路
用户自然语言需求
↓
Agent 智能体
负责理解目标、拆解任务、规划步骤
↓
Context / RAG / Memory
提供项目背景、知识检索和历史记忆
↓
Loop Engine
持续执行、观察、反馈和修正
↓
Function Call
生成结构化工具调用指令
↓
MCP / JSON-RPC
标准化连接外部工具和上下文资源
↓
Skills
封装可复用的专业能力
↓
Tools
执行文件读写、终端命令、数据库查询、API 调用
↓
运行环境
Git / Node.js / Shell / IDE / 文件系统 / 内部服务
横向治理能力
Harness 安全护栏贯穿全链路:
权限控制、数据脱敏、人工确认、审计日志、限流熔断、沙箱隔离、回滚机制
核心金句回顾
Function Call 让 AI 能调用工具;
MCP 让工具能标准化接入;
Skill 让能力能复用组合;
Agent 让任务能自主执行;
Loop 让结果能持续逼近目标;
Harness 让整个过程安全可控。
32|落地建议:公司内部如何使用 AI Coding?
最后给出一套适合团队落地的实践建议。
使用原则
-
先低风险,后高价值
从脚本、测试、文档、查询、重构辅助等场景开始。 -
先只读,后写入
企业 Skill 建设优先接入知识库、日志、工单等只读能力。 -
先人审,后自动化
所有代码修改、数据库写入、生产发布都必须有人类确认。 -
先规范,后规模化
建立 AI 使用规范、Prompt 模板、Review 清单和审计机制。 -
先沉淀,再复用
把高频任务沉淀为内部 Skill 和标准工作流。
推荐落地路径
阶段 1:个人效率提升
脚本、SQL、单测、文档、代码解释
阶段 2:团队协作增强
统一提示词模板、代码审查规范、AI 辅助需求分析
阶段 3:内部 Skill 建设
知识库、日志、工单、数据库只读查询
阶段 4:Agent 工作流
在权限和审计约束下实现多步骤自动化
阶段 5:企业级治理
统一权限、审计、监控、脱敏、回滚和安全策略
最终结论
AI Coding 的目标不是替代工程师,而是把工程师从重复劳动中释放出来,让人更专注于判断、设计、审查和创新。
33|结束页
从“会聊天的 AI”到“能协作的工程伙伴”
AI 编程的真正价值,不在于它能一次生成多少代码,而在于它能否在安全、可控、可审查的边界内,持续帮助团队完成真实工程任务。
关键 Takeaways
- Function Call 是行动能力的起点。
- MCP 是工具接入的标准桥梁。
- Skill 是企业能力复用的关键资产。
- Agent 是目标驱动的任务执行主体。
- Loop Engineering 是复杂任务稳定落地的方法论。
- 安全治理 是 AI Coding 进入企业生产流程的前提。
收尾金句
让 AI 写代码只是开始;
让 AI 安全、稳定、可控地参与工程流程,才是 Vibe Coding 的真正终点。
更多推荐




所有评论(0)