从提示词到智能体:读懂 Harness Engineering(驾驭工程)的完整拼图
摘要: 本文系统介绍了大语言模型(LLM)应用的三个关键技术层级: 提示词工程:通过角色设定、格式约束等设计输入文本,控制模型输出; 上下文工程:动态管理信息(召回/压缩/组装),解决上下文窗口限制; 驾驭工程(Harness Engineering):构建记忆层、反馈层、编排层、执行层,实现AI Agent的规划与自愈能力。最终通过规范驱动开发(SDD)落地,使LLM从"会说话&quo
一、起点:提示词工程
一句话理解:
LLM 本质只是个“下一个词预测器”。 它只会根据你给的前文,猜接下来大概率该输出什么字。
如果你给的指令太笼统(比如“写个方案”),结果往往天马行空。
解决方案:
我们在输入里加上 角色设定、格式约束、步骤拆解,让大模型沿着既定轨道输出。
- 这种被精心设计过的输入文本,就叫 提示词。
- 这种有意识地设计、调整、优化提示词,以稳定控制模型输出内容和格式的技术手段,就叫 提示词工程。
二、进阶:上下文工程
新的问题:
提示词虽好,但光靠几句指令不够。我们常常需要塞给大模型一堆资料(文档、历史记录、工具结果)。这些打包一起发给大模型的所有信息,统称为上下文。
提示词只是上下文的一小部分。
核心限制:
大模型一次性能处理的上下文长度是有限的(即上下文窗口)。资料多了塞不下,少了又不够准。
解决方案 —— 上下文工程:
一套动态管理上下文的技术策略,核心三步:
| 步骤 | 作用 |
|---|---|
| 召回 | 从海量信息中捞取最相关的内容片段 |
| 压缩 | 把冗长的历史对话或文档提炼成摘要 |
| 组装 | 把提示词、召回结果、历史摘要拼进有限窗口 |
不同的 AI 工具(如 Cursor、Claude、ChatGPT)在上下文工程的具体实现上各有千秋,但逻辑相通。
三、终局:Harness Engineering(驾驭工程)
1. 引入手脚:执行层
提示词工程让模型 不乱说话,上下文工程让模型 不缺信息。但它依然只是个话匣子,不会动手。
于是我们引入 文件系统、MCP 协议、API 调用 等外部工具,构成执行层。
2. 形成闭环:ReAct 循环
把上述能力串成一个流程,外部套一层循环:
- 组装上下文(提示词工程 + 上下文工程)发给大模型。
- 大模型思考,决定下一步是说话还是调用工具。
- 外部程序执行工具操作,把结果塞回上下文。
- 继续推理与执行……
这种 边思考边行动 的循环模式,就是著名的 ReAct。而这一整套能通过聊天帮你干活儿的程序,就是 AI Agent。
3. 工程外壳的四个支柱
但是,循环一长,上下文就容易膨胀和稀释。早期的目标和约束被海量中间信息冲淡,大模型开始“忘记初心”。
于是,在 ReAct 循环之上,必须构筑一套工程外壳来驾驭它,这就是 Harness Engineering。
| 层级 | 核心职责 | 解决的问题 |
|---|---|---|
| 记忆层 | 存储可复用的核心规则、项目背景、约束文件(如 Markdown 规则书) | 防止目标被长上下文冲淡 |
| 反馈层 | 校验执行结果,发现错误自动回传并尝试修复 | 让 Agent 具备自愈能力 |
| 编排层 | 全局规划、任务拆解、全流程管控、定义结束条件 | 防止 Agent 无头苍蝇式乱跑 |
| 执行层 | 调用 MCP、文件系统等外部工具干活 | 赋予行动力 |
定义总结:
Harness Engineering(驾驭工程)= 记忆层 + 反馈层 + 编排层 + 执行层
也可以说:
AI Agent = LLM + Harness Engineering

四、Harness Engineering 如何落地?
理论讲完了,实际怎么把这层“外壳”套到大模型身上?目前主流做法是 规则驱动。
方法一:手写 MD 说明书
自己编写 Markdown 文件,明确规定:
- 项目的背景和目标是什么?
- 必须遵守的规范是什么?
- 绝对禁止的操作有哪些?
- 遇到特定场景应该先做什么、后做什么?
Agent 每次启动都强制读取这份 MD,将其作为记忆层的核心骨架。
方法二:借助 Spec-Kit 插件(SDD 模式)
引入类似 Spec-Kit 的插件工具,让流程自动化:
- 生成约束:根据项目背景生成规范草稿。
- 明确需求:把模糊想法变成结构化文档。
- 制定计划:拆解实施步骤。
- 拆解任务:细化到可执行的粒度。
- 开始实现:Agent 按照计划逐步执行。
每个阶段都会自动更新 MD 文件,确保规范和进度始终保持同步。
这套开发方式被称为 Spec-Driven Development(规范驱动开发,SDD)。
本质上,SDD 就是 Harness Engineering 在工程实践中的一种落地形态。
五、一图总结:三层工程的递进关系
| 工程层级 | 核心目标 | 比喻 |
|---|---|---|
| 提示词工程 | 让模型明白你的需求和标准 | 教它怎么说话 |
| 上下文工程 | 给模型注入精准有效的信息 | 告诉它说些什么 |
| 驾驭工程 | 让模型持续按规范执行并交付成果 | 管控它如何做事 |
从会说话,到懂知识,再到能干活、会纠错、有规划——这就是 Harness Engineering 赋予大模型的全新生命形态。
更多推荐


所有评论(0)