一、起点:提示词工程

一句话理解:
LLM 本质只是个“下一个词预测器”。 它只会根据你给的前文,猜接下来大概率该输出什么字。

如果你给的指令太笼统(比如“写个方案”),结果往往天马行空。

解决方案:
我们在输入里加上 角色设定、格式约束、步骤拆解,让大模型沿着既定轨道输出。

  • 这种被精心设计过的输入文本,就叫 提示词
  • 这种有意识地设计、调整、优化提示词,以稳定控制模型输出内容和格式的技术手段,就叫 提示词工程

二、进阶:上下文工程

新的问题:
提示词虽好,但光靠几句指令不够。我们常常需要塞给大模型一堆资料(文档、历史记录、工具结果)。这些打包一起发给大模型的所有信息,统称为上下文

提示词只是上下文的一小部分

核心限制:
大模型一次性能处理的上下文长度是有限的(即上下文窗口)。资料多了塞不下,少了又不够准。

解决方案 —— 上下文工程:
一套动态管理上下文的技术策略,核心三步:

步骤 作用
召回 从海量信息中捞取最相关的内容片段
压缩 把冗长的历史对话或文档提炼成摘要
组装 把提示词、召回结果、历史摘要拼进有限窗口

不同的 AI 工具(如 Cursor、Claude、ChatGPT)在上下文工程的具体实现上各有千秋,但逻辑相通。


三、终局:Harness Engineering(驾驭工程)

1. 引入手脚:执行层

提示词工程让模型 不乱说话,上下文工程让模型 不缺信息。但它依然只是个话匣子,不会动手。

于是我们引入 文件系统、MCP 协议、API 调用 等外部工具,构成执行层

2. 形成闭环:ReAct 循环

把上述能力串成一个流程,外部套一层循环:

  1. 组装上下文(提示词工程 + 上下文工程)发给大模型。
  2. 大模型思考,决定下一步是说话还是调用工具。
  3. 外部程序执行工具操作,把结果塞回上下文。
  4. 继续推理与执行……

这种 边思考边行动 的循环模式,就是著名的 ReAct。而这一整套能通过聊天帮你干活儿的程序,就是 AI Agent

3. 工程外壳的四个支柱

但是,循环一长,上下文就容易膨胀和稀释。早期的目标和约束被海量中间信息冲淡,大模型开始“忘记初心”。

于是,在 ReAct 循环之上,必须构筑一套工程外壳来驾驭它,这就是 Harness Engineering

层级 核心职责 解决的问题
记忆层 存储可复用的核心规则、项目背景、约束文件(如 Markdown 规则书) 防止目标被长上下文冲淡
反馈层 校验执行结果,发现错误自动回传并尝试修复 让 Agent 具备自愈能力
编排层 全局规划、任务拆解、全流程管控、定义结束条件 防止 Agent 无头苍蝇式乱跑
执行层 调用 MCP、文件系统等外部工具干活 赋予行动力

定义总结:

Harness Engineering(驾驭工程)= 记忆层 + 反馈层 + 编排层 + 执行层

也可以说:

AI Agent = LLM + Harness Engineering


在这里插入图片描述

四、Harness Engineering 如何落地?

理论讲完了,实际怎么把这层“外壳”套到大模型身上?目前主流做法是 规则驱动

方法一:手写 MD 说明书

自己编写 Markdown 文件,明确规定:

  • 项目的背景和目标是什么?
  • 必须遵守的规范是什么?
  • 绝对禁止的操作有哪些?
  • 遇到特定场景应该先做什么、后做什么?

Agent 每次启动都强制读取这份 MD,将其作为记忆层的核心骨架。

方法二:借助 Spec-Kit 插件(SDD 模式)

引入类似 Spec-Kit 的插件工具,让流程自动化:

  1. 生成约束:根据项目背景生成规范草稿。
  2. 明确需求:把模糊想法变成结构化文档。
  3. 制定计划:拆解实施步骤。
  4. 拆解任务:细化到可执行的粒度。
  5. 开始实现:Agent 按照计划逐步执行。

每个阶段都会自动更新 MD 文件,确保规范和进度始终保持同步。

这套开发方式被称为 Spec-Driven Development(规范驱动开发,SDD)

本质上,SDD 就是 Harness Engineering 在工程实践中的一种落地形态。


五、一图总结:三层工程的递进关系

工程层级 核心目标 比喻
提示词工程 让模型明白你的需求和标准 教它怎么说话
上下文工程 给模型注入精准有效的信息 告诉它说些什么
驾驭工程 让模型持续按规范执行并交付成果 管控它如何做事

会说话,到懂知识,再到能干活、会纠错、有规划——这就是 Harness Engineering 赋予大模型的全新生命形态。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐