2026年AI开发者工具箱:从Harness Engineering到多智能体协作,三套实战思路一次讲透
单Agent正在被多Agent取代——一个全能助手不如一组专精专家Prompt Engineering已经不够用了——从调提示词到管上下文,再到驾驭整个执行系统这三个话题分别对应了三份最近在B站上非常火的实战分享,我把核心内容整理出来,顺便聊聊我的理解。话题核心结论Agent = Model + Harness,模型之外的一切都是Harness多智能体团队专精胜于全能,隔离优于共享,像搭团队一样搭
AI工程正在从"调Prompt"走向"造系统"。本文基于三份最新的AI实战分享,拆解三个关键话题:Harness Engineering到底是什么、如何用OpenClaw搭建多智能体团队、以及如何把Claude Design变成人人都能用的Skill。
写在前面
最近AI圈有两个明显趋势:
- 单Agent正在被多Agent取代——一个全能助手不如一组专精专家
- Prompt Engineering已经不够用了——从调提示词到管上下文,再到驾驭整个执行系统
这三个话题分别对应了三份最近在B站上非常火的实战分享,我把核心内容整理出来,顺便聊聊我的理解。
一、Harness Engineering:AI工程的第三次重心迁移
从Prompt到Harness,发生了什么?
过去两年,AI工程经历了三次明显的重心迁移:
| 阶段 | 关注点 | 核心问题 |
|---|---|---|
| Prompt Engineering | 怎么把话说清楚 | 模型有没有听懂你在说什么 |
| Context Engineering | 信息怎么喂进去 | 模型有没有拿到足够且正确的信息 |
| Harness Engineering | 整个系统怎么跑稳 | 模型在真实执行中能不能持续做对 |
这三个阶段不是替代关系,而是层层嵌套的包含关系——Harness包含了Context,Context包含了Prompt。
一个通俗的比喻
假设你要派一个新人去完成一次重要客户拜访:
- Prompt Engineering = 把话讲清楚:"见面先寒暄→介绍方案→问需求→确认下一步"
- Context Engineering = 把资料准备齐全:客户背景、沟通记录、产品报价、竞品情况、会议目标
- Harness Engineering = 持续监督纠偏:带Checklist、关键节点汇报、会后核实纪要、发现偏差马上纠正、按标准验收结果
Harness的本质是:不只让模型更会想,更要让它别跑偏、跑得稳、出了错还能拉回来。
一个成熟的Harness包含六层
来自实践经验的拆解:
第一层:Context(信息管理)
- 角色和目标定义:模型要知道自己是谁、任务是什么、成功标准是什么
- 信息裁剪:不是给越多越好,而是越相关越好
- 结构化组织:固定规则放哪、当前任务放哪、运行状态放哪、外部证据放哪
第二层:Tool System(工具系统)
- 给什么工具:太少能力不够,太多会乱用
- 什么时候调用:不该查的时候别乱查,该查的时候也别硬答
- 结果怎么回喂:搜索回来的几十条结果不能原封不动塞回去
第三层:Execution Orchestration(执行编排)
- 很多Agent不是某一步不会,而是不会把所有步骤串起来
- 任务拆解、步骤依赖、并行执行、状态管理
第四层:Verification(验证机制)
- 每一步的输出都要校验
- 换一个新上下文检查自己的输出,打破"自我感觉良好"
第五层:Recovery(错误恢复)
- 失败了怎么重试、怎么回滚、怎么降级
- 不是每个错误都需要从头来
第六层:Observability(可观测性)
- 全链路的日志和监控
- 出了问题能快速定位
实战数据
一个朋友团队的真实案例:同样的模型、同样的Prompt,只改了任务拆解方式、状态管理、关键步骤校验和失败恢复机制——成功率从70%拉到95%以上。
Harness Engineering不是玄学,它就是那层"让模型稳定交付"的工程外壳。
二、OpenClaw多智能体团队:7个专精Agent的实战配置
为什么不能做一个"全能Agent"?
很多人装好OpenClaw后的第一反应:把所有技能塞进一个Agent,又能写文章又能分析股票还能生图,岂不美哉?
实践证明,这是个坑。原因有三:
1. 上下文污染
一个Agent的上下文窗口是有限的。生图的提示词模板、投资分析的框架、写作的风格指南全塞进去,注意力严重分散。让它写文章,它可能在行文中不自觉地使用投资分析的术语;让它分析股票,它可能用写作风格来美化数据。
2. 技能冲突
不同场景需要的工具和权限完全不同。开发助手需要ADB/Shell来调度Code,这个权限对写作助手完全多余且有安全风险。投资助手需要访问股票数据接口,社区助手需要访问Reddit。全部开放给一个Agent,违反最小权限原则。
3. 人设冲突
一个好的Agent需要清晰的人设。投资助手应该谨慎、数据驱动、风险意识强;写作助手应该有温度、有文采、善于结构化表达;社区助手需要有趣、有个性、善于社交。这些截然不同的性格,很难在一个Agent上和谐共存。
结论:专精胜于全能,隔离优于共享。
七个Agent的配置方案
| Agent | 定位 | 核心能力 |
|---|---|---|
| 生图助手 | 配图生成 | 记住审美偏好,自动匹配提示词模板 |
| 资讯助手 | AI日报 | 自动抓取信息源,生成结构化日报 |
| 开发助手 | 远程开发 | 手机发消息就能排查问题、写代码 |
| 投资助手 | 投资参谋 | 拉取个股数据、分析走势、生成买卖建议 |
| 社区助手 | 社区运营 | 半自动发帖、回复、总结社区观点 |
| 写作助手 | 内容创作 | 记住写作风格,搜资料、梳大纲、优化表达 |
| 智能专家 | 团队协调 | 了解所有Agent能力,复杂任务时协调协作 |
关键设计思路
Agent间的协作机制:主Agent发起调用后可以继续做自己的事(非阻塞),被调用Agent完成后会主动推送结果回来。就像你让同事帮忙做一件事,他做完了会来告诉你。
权限隔离:通过serveAgent配置明确声明每个Agent允许调用哪些其他Agent,最小权限原则。
记忆独立:每个Agent拥有独立的短期记忆(对话上下文)、中期记忆(近期工作记录)和长期记忆(跨对话的偏好和决策)。互不干扰。
底层架构解析
OpenClaw中,每个Agent的组成要素:
- 模型:可为不同Agent绑定不同模型(写作用擅长聊天的模型,开发用擅长编码的模型)
- 记忆:短期(对话上下文)+ 中期(memory/YYYY-MM-DD.md每日记录)+ 长期(MEMORY.md跨对话沉淀)
- 人设:通过SOUL.md、IDENTITY.md、USER.md等文件定义
- 工具:内置工具 + Skills(可独立配置黑白名单)
- 规划:依赖大模型推理能力 + AGENTS.md中的执行手册
- 环境:每个Agent独立workspace,文件互不干扰
三、Claude Design Skill:让每个人都成为顶级网站设计师
Claude Design是什么?
Anthropic发布的Claude Design,可以理解为"设计师版的Claude Code"——左边打字,右边直接出设计稿(本质是可运行的网页)。
它和传统设计工具的区别:
| 传统工具 | Claude Design | |
|---|---|---|
| 主导者 | 人在画布上操作 | AI生成,人做审核 |
| 输出物 | 设计图/图片 | 可运行的代码 |
| 交互 | 点击、拖拽 | 自然语言描述 |
提示词拆解:五个核心设计
Claude Design上线不到24小时,完整提示词就被扒出来了。其中最有价值的部分:
1. 动态角色定位
开头第一句:"你是一个专家级设计师,而用户是你的产品经理。"
不是"你是一个AI助手",而是设计师和产品经理的关系——AI做决策更果断,但关键决策要问你。而且会根据任务动态切换身份:做动画就当动效设计师,做原型就当UX设计师,做PPT就当Deck设计师。
2. 六步工作流
理解需求 → 探索资源 → 制定计划 → 搭建结构 → 完成验证 → 极简总结
关键细节:什么时候该问、什么时候直接开干——有清晰的判断标准。你说"帮我做个PPT",他可能先问几个问题;你说"帮我做个PPT,全员会马上就要用了,10分钟",他直接开干。
3. 去AI味清单
这是最有价值的部分。AI生成网页的典型毛病:
- ❌ 紫粉蓝渐变到处都是
- ❌ 大圆角卡片铺满页面
- ❌ Emoji当图标
- ❌ 假数据填充
- ❌ 烂大街的字体
Claude Design把这些雷区一条条列出来,逼着AI不能走老套路。
4. 色彩系统:用OKLCH替代HSL
传统HSL色彩空间感知不均匀——同样亮度值,黄色比蓝色看着亮一大截。AI如果用HSL随机配色,数值没问题但看着不舒服。
OKLCH是感知均匀的色彩空间,保持亮度和色度不变,只转变色相角,出来的颜色自然和谐。这个小细节,网页的高级感一下子就上来了。
5. 内容原则:用1000个No换一个Yes
引用乔布斯的话——每个元素都必须证明自己为什么应该在那儿。觉得页面空?用留白解决,不能靠塞东西。一个大胆的留白,比10个凑数的板块更有表现力。
做成OpenClaw Skill
由于Claude Design在国国内使用极其困难(没有API,不能接入自己的工作流),核心能力靠的就是那套泄露的提示词。于是有人(code秘密花园)把核心功能提炼成了一个OpenClaw Skill:web-design-engineer。
关键优化:
- 写代码之前必须先用自然语言说清楚设计系统(配色、字体、间距)
- 尽早出一个带假设和占位符的最小版本(V0),而不是花几倍时间直接出精雕细琢的V1
- 补充了更多去AI味的条目
- 增加了经过验证的字体和配色参考对照表
实测效果:同一套提示词、同一个模型(Claude Opus 4.7),有Skill和没Skill的版本差距非常明显——没用的版本是教科书式的落地页结构,典型的AI霓虹渐变感;用了Skill的版本像一个有经验的设计师的杰作,配色深沉高级,布局有创意。
四、三者的共性:AI工程正在从"调参"走向"造系统"
把这三个话题放在一起看,有一个共同趋势:
AI的能力瓶颈已经不在模型本身,而在模型外面那层"壳"。
- Harness Engineering告诉你:模型再聪明,没有好的执行编排和验证机制,成功率照样只有70%
- OpenClaw多智能体告诉你:一个全能Agent不如一组专精Agent,隔离和协作才是正道
- Claude Design Skill告诉你:同样的模型,一套好的提示词系统可以让输出质量产生质的飞跃
2026年的AI开发者,核心竞争力正在从"会不会调Prompt"变成"能不能造出稳定交付的系统"。
总结
| 话题 | 核心结论 |
|---|---|
| Harness Engineering | Agent = Model + Harness,模型之外的一切都是Harness |
| 多智能体团队 | 专精胜于全能,隔离优于共享,像搭团队一样搭Agent |
| Claude Design Skill | 提示词系统工程化,从"一句提示词"到"一套设计体系" |
如果你也在做AI应用落地,建议重点关注Harness Engineering的六层架构——它可能会成为2026年AI工程最重要的方法论之一。
参考资料:
《龙虾装上了,可以用来干啥?分享下我的 OpenClaw 多智能体团队搭建经验!》,B站视频,code秘密花园,2026年5月8日。本文通过Ai好记智能解析获取。
《最近爆火的 Harness Engineering 到底是啥?一期讲透!》,B站视频,code秘密花园,2026年5月8日。本文通过Ai好记智能解析获取。
《我把 Claude Design 做成了 Skill,人人都能成为顶级网站设计师》,B站视频,code秘密花园,2026年5月8日。本文通过Ai好记智能解析获取。
更多推荐




所有评论(0)