提示词、Skill、MCP、Agent 到底什么关系？一张图测试人一看就懂

Jasmine839

76人浏览 · 2026-07-03 17:56:41

Jasmine839 · 2026-07-03 17:56:41 发布

昨天一个学员发消息问我："我在各种地方看到提示词、Skill、MCP、Agent，这几个词好像在说同一件事，又好像不是，到底什么关系？"

这问题不算罕见。这四个词最近两年出现频率极高，很多人用了很久也没真正搞清楚边界。今天统一讲一遍，用一个比喻拉通，读完应该不会再混。

做个比喻

把 AI 想象成一个全能助理，刚刚入职，什么都会，但需要你告诉他怎么做事。

提示词：你口头交代他的指令

Skill：写成文档的操作手册，交代他这类事情固定怎么处理

MCP：给他配的工具箱，里面有数据库权限、查询接口、发消息通道

Agent：让他不只是接收指令，而是主动帮你完成一个多步任务，自己思考怎么推进

这四个东西，解决的是同一个 AI 助手在不同层面的问题：说什么、怎么记住怎么说、能用什么工具、能不能自己规划。

如果用建筑比喻：

Agent = 房屋的总设计师 + 住户，既是使用工具的人，也是规划结构的决策者。 它住在房子里，决定今天用洗衣机还是电脑，当发现地基（提示词）不稳时，它还能调取工具来“修缮”地基。

Skill = 家用电器/工具（如洗衣机、电脑），具备特定功能的模块（如发邮件、查天气），平时待命，被需要时才启动。

MCP = 水电煤气管网，负责连通外部世界，传输数据、调用工具、反馈状态，是维持运转的“生命线”。

提示词 = 地基，奠定人格、目标和基础规则，看不见但决定上限。

一、提示词（Prompt）

它到底是什么

提示词就是你给 AI 的输入，包括你的问题、指令、背景信息、角色要求、输出格式限制……凡是你发给 AI 的文字，都叫提示词。

说白了，就是"你和 AI 说的话"。

但有意思的地方在于：同样一件事，怎么说，结果差很多。

你说"帮我分析这个需求"，AI 可能给你一堆废话。你说"你是一位测试架构师，请基于以下需求，按边界值分析和等价类划分方法，输出带优先级的测试点列表，格式为 Markdown 表格"，AI 给你的结果可以直接用。

这就是提示词工程要解决的核心问题：精准描述意图，减少 AI 的猜测空间。

提示词有几个关键要素

要素	说明	例子
角色定义	告诉 AI 以什么身份回答	"你是一位资深测试工程师"
任务描述	明确做什么事	"分析以下功能需求的测试点"
背景信息	输入材料	粘贴需求文档内容
约束条件	输出格式、范围、边界	"只考虑正向流程，输出不超过10条"
输出格式	你希望看到的样子	"用 Markdown 表格，含优先级列"

提示词越结构化，AI 越好配合。这不是因为 AI 笨，而是它的能力范围太宽，需要你给它收窄。

二、Skill（技能包）

跟提示词有什么区别

提示词是你每次临时说的话。Skill 是把一套"怎么跟 AI 说这类事"的最佳实践固化下来的文档。

还是用助理比喻：提示词是你当下口头交代的指令，Skill 是你交给他的 SOP 操作手册，里面写清楚这类任务的标准处理方式、输出格式、注意事项。

以 WorkBuddy 平台为例，一个 Skill 文件（SKILL.md）通常包含：

角色定义触发场景处理流程输出模板知识库

比如我们之前做的 test-requirement-analysis Skill，里面内嵌了通用测试点检查清单（附录A）和 RPN 风险识别模型（附录B）。每次用它分析需求，不用重新描述方法论，Skill 里已经写好了怎么分析、怎么输出，直接套用就行。

Skill 的价值在哪里

可复用。 同样的工作流，第一次要花几十分钟摸清楚怎么让 AI 配合，后面每次只需要触发 Skill 名称，结果稳定一致。

可传承。 你总结的提示词最佳实践可以分享给团队，不用每个人自己摸索。

可迭代。 某次发现某类需求 AI 输出质量不对，打开 Skill 文件改一下规则，下次就修复了。

三、MCP（Model Context Protocol）

这个词最容易吓人

MCP 是 Anthropic 在 2024 年底提出的一套开放协议，全称 Model Context Protocol。听起来很技术，但核心只有一件事：让 AI 能安全、标准化地使用外部工具和数据。

继续用助理比喻：提示词和 Skill 解决的是"你怎么说"和"说什么规范"，MCP 解决的是"他能用什么工具"。

你交代助理帮你查一下飞书文档里的会议纪要，他能不能查，取决于你有没有给他飞书的访问权限，以及这个访问权限是通过什么通道给的。MCP 就是这个"通道标准"——它定义了 AI 怎么连接外部系统、怎么调用工具、怎么读写数据。

MCP 能接的工具举几个例子

工具类型	实际例子
文件系统	读写本地文件、创建目录
数据库	查询 MySQL、PostgreSQL
协同工具	飞书文档、飞书日历、Notion
代码平台	GitHub、TAPD
搜索	网页搜索、内部知识库检索
自定义接口	企业内部的任何 API

有了 MCP，AI 不再只是"聊天工具"，而是真的能帮你做事——查数据库、写文档、创建任务、发消息。不是你把信息复制进对话框，而是 AI 直接拿数据源里的内容来工作。

对测试工程师意味着什么

以前你用 AI 分析 Bug，得自己把 TAPD 上的 Bug 列表复制出来粘贴进去，输出的结果再自己抄回去。有了 MCP 接入 TAPD，AI 可以直接读取 Bug 数据，分析完之后直接写回系统，整个流程不需要人工中转。

这不是概念，WorkBuddy 里的 TAPD 连接器就是基于 MCP 协议实现的。

四、Agent（智能体）

这个词被用烂了，但核心不复杂

Agent 的本质是：AI 从"回答问题"变成"完成任务"。

正常的 AI 交互是一问一答—你说一句，它回一句。每次都需要你推进。

Agent 不同。你给它一个目标（"帮我整理本周所有 Bug，写成周报发给测试组长"），它自己拆分步骤、调用工具、处理中间结果，直到任务完成。整个过程你不需要在旁边盯着，它自己推进。

用助理比喻：普通 AI 是接线员，你告诉他什么，他做什么；Agent 是项目经理，你说"这个事情帮我搞定"，他自己协调资源、安排步骤、把结果交回来。

Agent 的核心能力构成

一个完整的 Agent 需要四个组件：

感知—读取输入。不只是文字，可以是图片、文件、数据库记录、API 返回结果。

推理—拆解任务，规划步骤，判断当前该做什么。这是 LLM 的核心能力。

行动—调用工具执行。这里就用到 MCP 了——没有工具接入，Agent 只能说，不能做。

记忆—短期记忆（当前对话上下文）和长期记忆（存到数据库或文件里，下次还能用）。

这四个能力缺一个，Agent 的自主性就会打折。一个没有工具的 Agent 只能输出文字；一个没有记忆的 Agent 每次都从头开始；一个推理能力差的 Agent 容易走偏执行错误步骤。

真实场景

以 Hermes Agent 为例—这是一个 UI 自动化测试 Agent。你告诉它"测试登录页面的错误提示文案是否正确"，它会自己：

1. 打开浏览器，导航到登录页

2. 输入错误的用户名密码

3. 截图，识别错误提示文案

4. 对比预期文案，判断是否通过

5. 输出测试结果，如果失败自动记录 Bug 截图

你不需要写一行 Selenium 代码，不需要维护定位器，Agent 自己完成了完整的测试执行。

五、四者之间的关系

搞清楚概念之后，来看它们怎么配合工作。

层级	是什么	解决什么问题	类比
提示词	你给 AI 的指令	精准传递意图	口头交代
Skill	固化的提示词最佳实践	可复用的工作规范	SOP 手册
MCP	AI 连接外部工具的协议	打通数据和操作权限	工具箱 + 权限卡
Agent	能自主规划执行的 AI	完成多步任务，不需人工推进	项目经理

它们不是互相替代的关系，而是分层叠加的关系：

没有好提示词，Skill 写不好

Skill 是对提示词工程的沉淀和复用

Agent 要自主做事，必须借助 MCP 提供的工具

Agent 的每一步推理，底层依然在执行提示词

换句话说：提示词是地基，Skill 更像房屋里的家用电器或专用工具，MCP 是水电煤气管网，Agent 既是使用工具的人，也是规划结构的决策者。

六、对测试工程师的实际影响

讲了这么多，落到我们的日常工作里，变化在哪里？

写测试点：以前手动拆。现在用 test-requirement-analysis Skill，传入需求文档，自动按 8 个维度输出测试点，带优先级和风险等级。

查 Bug 数据：以前从 TAPD 导出 Excel，粘贴进对话框。现在通过 MCP 连接 TAPD，AI 直接读数据，输出 Bug 周报。

写自动化脚本：以前自己写 Selenium 定位器和断言。现在描述测试场景，Agent 自动生成可执行脚本，有的甚至能直接跑起来。

整理测试报告：以前填表格、汇总数字。现在触发 test-report-writer Skill，输入测试执行数据，自动生成带受众视图的测试报告。

这四个能力不是独立的，实际工作里往往是叠加使用的：一个 Agent 借助 MCP 读取数据，按照 Skill 定义的流程处理，每一步的推理里都在执行精心设计的提示词。

能把这四个东西用起来的测试工程师，和还在手工做这些事的人，效率差距是显而易见的。

如果你也在探索 AI 辅助测试，点击关注，持续分享实战案例。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

AI Agent 面试题 720：如何实现Agent的安全日志的实时分析？

权限控制与沙箱是 AI Agent 技术体系中的重要组成部分。简单来说，它涉及到 Agent 如何在 Agent安全与对齐层面实现智能化的行为和决策。在实际应用中，权限控制与沙箱的核心目标是让 Agent 能够更加高效、准确地完成特定任务。这需要我们深入理解其底层原理和实现机制。从学术角度来看，权限控制与沙箱的研究可以追溯到人工智能的早期阶段。早在 1950 年代，Alan Turing

龙虾开发者社区

AI Agent 面试题 714：如何设计Agent的安全合规自动化检查流程？

对齐技术是 AI Agent 技术体系中的重要组成部分。简单来说，它涉及到 Agent 如何在 Agent安全与对齐层面实现智能化的行为和决策。在实际应用中，对齐技术的核心目标是让 Agent 能够更加高效、准确地完成特定任务。这需要我们深入理解其底层原理和实现机制。从学术角度来看，对齐技术的研究可以追溯到人工智能的早期阶段。早在 1950 年代，Alan Turing 就提出了关于机器智

龙虾开发者社区

AI Agent 面试题 726：如何设计Agent的安全事件的根因分析流程？

红队测试是 AI Agent 技术体系中的重要组成部分。简单来说，它涉及到 Agent 如何在 Agent安全与对齐层面实现智能化的行为和决策。在实际应用中，红队测试的核心目标是让 Agent 能够更加高效、准确地完成特定任务。这需要我们深入理解其底层原理和实现机制。从学术角度来看，红队测试的研究可以追溯到人工智能的早期阶段。早在 1950 年代，Alan Turing 就提出了关于机器智