AI工程正在从"调Prompt"走向"造系统"。本文基于三份最新的AI实战分享,拆解三个关键话题:Harness Engineering到底是什么、如何用OpenClaw搭建多智能体团队、以及如何把Claude Design变成人人都能用的Skill。


写在前面

最近AI圈有两个明显趋势:

  1. 单Agent正在被多Agent取代——一个全能助手不如一组专精专家
  2. Prompt Engineering已经不够用了——从调提示词到管上下文,再到驾驭整个执行系统

这三个话题分别对应了三份最近在B站上非常火的实战分享,我把核心内容整理出来,顺便聊聊我的理解。


一、Harness Engineering:AI工程的第三次重心迁移

从Prompt到Harness,发生了什么?

过去两年,AI工程经历了三次明显的重心迁移:

阶段 关注点 核心问题
Prompt Engineering 怎么把话说清楚 模型有没有听懂你在说什么
Context Engineering 信息怎么喂进去 模型有没有拿到足够且正确的信息
Harness Engineering 整个系统怎么跑稳 模型在真实执行中能不能持续做对

这三个阶段不是替代关系,而是层层嵌套的包含关系——Harness包含了Context,Context包含了Prompt。

一个通俗的比喻

假设你要派一个新人去完成一次重要客户拜访:

  • Prompt Engineering = 把话讲清楚:"见面先寒暄→介绍方案→问需求→确认下一步"
  • Context Engineering = 把资料准备齐全:客户背景、沟通记录、产品报价、竞品情况、会议目标
  • Harness Engineering = 持续监督纠偏:带Checklist、关键节点汇报、会后核实纪要、发现偏差马上纠正、按标准验收结果

Harness的本质是:不只让模型更会想,更要让它别跑偏、跑得稳、出了错还能拉回来。

一个成熟的Harness包含六层

来自实践经验的拆解:

第一层:Context(信息管理)

  • 角色和目标定义:模型要知道自己是谁、任务是什么、成功标准是什么
  • 信息裁剪:不是给越多越好,而是越相关越好
  • 结构化组织:固定规则放哪、当前任务放哪、运行状态放哪、外部证据放哪

第二层:Tool System(工具系统)

  • 给什么工具:太少能力不够,太多会乱用
  • 什么时候调用:不该查的时候别乱查,该查的时候也别硬答
  • 结果怎么回喂:搜索回来的几十条结果不能原封不动塞回去

第三层:Execution Orchestration(执行编排)

  • 很多Agent不是某一步不会,而是不会把所有步骤串起来
  • 任务拆解、步骤依赖、并行执行、状态管理

第四层:Verification(验证机制)

  • 每一步的输出都要校验
  • 换一个新上下文检查自己的输出,打破"自我感觉良好"

第五层:Recovery(错误恢复)

  • 失败了怎么重试、怎么回滚、怎么降级
  • 不是每个错误都需要从头来

第六层:Observability(可观测性)

  • 全链路的日志和监控
  • 出了问题能快速定位

实战数据

一个朋友团队的真实案例:同样的模型、同样的Prompt,只改了任务拆解方式、状态管理、关键步骤校验和失败恢复机制——成功率从70%拉到95%以上

Harness Engineering不是玄学,它就是那层"让模型稳定交付"的工程外壳。


二、OpenClaw多智能体团队:7个专精Agent的实战配置

为什么不能做一个"全能Agent"?

很多人装好OpenClaw后的第一反应:把所有技能塞进一个Agent,又能写文章又能分析股票还能生图,岂不美哉?

实践证明,这是个坑。原因有三:

1. 上下文污染

一个Agent的上下文窗口是有限的。生图的提示词模板、投资分析的框架、写作的风格指南全塞进去,注意力严重分散。让它写文章,它可能在行文中不自觉地使用投资分析的术语;让它分析股票,它可能用写作风格来美化数据。

2. 技能冲突

不同场景需要的工具和权限完全不同。开发助手需要ADB/Shell来调度Code,这个权限对写作助手完全多余且有安全风险。投资助手需要访问股票数据接口,社区助手需要访问Reddit。全部开放给一个Agent,违反最小权限原则。

3. 人设冲突

一个好的Agent需要清晰的人设。投资助手应该谨慎、数据驱动、风险意识强;写作助手应该有温度、有文采、善于结构化表达;社区助手需要有趣、有个性、善于社交。这些截然不同的性格,很难在一个Agent上和谐共存。

结论:专精胜于全能,隔离优于共享。

七个Agent的配置方案

Agent 定位 核心能力
生图助手 配图生成 记住审美偏好,自动匹配提示词模板
资讯助手 AI日报 自动抓取信息源,生成结构化日报
开发助手 远程开发 手机发消息就能排查问题、写代码
投资助手 投资参谋 拉取个股数据、分析走势、生成买卖建议
社区助手 社区运营 半自动发帖、回复、总结社区观点
写作助手 内容创作 记住写作风格,搜资料、梳大纲、优化表达
智能专家 团队协调 了解所有Agent能力,复杂任务时协调协作

关键设计思路

Agent间的协作机制:主Agent发起调用后可以继续做自己的事(非阻塞),被调用Agent完成后会主动推送结果回来。就像你让同事帮忙做一件事,他做完了会来告诉你。

权限隔离:通过serveAgent配置明确声明每个Agent允许调用哪些其他Agent,最小权限原则。

记忆独立:每个Agent拥有独立的短期记忆(对话上下文)、中期记忆(近期工作记录)和长期记忆(跨对话的偏好和决策)。互不干扰。

底层架构解析

OpenClaw中,每个Agent的组成要素:

  • 模型:可为不同Agent绑定不同模型(写作用擅长聊天的模型,开发用擅长编码的模型)
  • 记忆:短期(对话上下文)+ 中期(memory/YYYY-MM-DD.md每日记录)+ 长期(MEMORY.md跨对话沉淀)
  • 人设:通过SOUL.md、IDENTITY.md、USER.md等文件定义
  • 工具:内置工具 + Skills(可独立配置黑白名单)
  • 规划:依赖大模型推理能力 + AGENTS.md中的执行手册
  • 环境:每个Agent独立workspace,文件互不干扰

三、Claude Design Skill:让每个人都成为顶级网站设计师

Claude Design是什么?

Anthropic发布的Claude Design,可以理解为"设计师版的Claude Code"——左边打字,右边直接出设计稿(本质是可运行的网页)。

它和传统设计工具的区别:

传统工具 Claude Design
主导者 人在画布上操作 AI生成,人做审核
输出物 设计图/图片 可运行的代码
交互 点击、拖拽 自然语言描述

提示词拆解:五个核心设计

Claude Design上线不到24小时,完整提示词就被扒出来了。其中最有价值的部分:

1. 动态角色定位

开头第一句:"你是一个专家级设计师,而用户是你的产品经理。"

不是"你是一个AI助手",而是设计师和产品经理的关系——AI做决策更果断,但关键决策要问你。而且会根据任务动态切换身份:做动画就当动效设计师,做原型就当UX设计师,做PPT就当Deck设计师。

2. 六步工作流

理解需求 → 探索资源 → 制定计划 → 搭建结构 → 完成验证 → 极简总结

关键细节:什么时候该问、什么时候直接开干——有清晰的判断标准。你说"帮我做个PPT",他可能先问几个问题;你说"帮我做个PPT,全员会马上就要用了,10分钟",他直接开干。

3. 去AI味清单

这是最有价值的部分。AI生成网页的典型毛病:

  • ❌ 紫粉蓝渐变到处都是
  • ❌ 大圆角卡片铺满页面
  • ❌ Emoji当图标
  • ❌ 假数据填充
  • ❌ 烂大街的字体

Claude Design把这些雷区一条条列出来,逼着AI不能走老套路。

4. 色彩系统:用OKLCH替代HSL

传统HSL色彩空间感知不均匀——同样亮度值,黄色比蓝色看着亮一大截。AI如果用HSL随机配色,数值没问题但看着不舒服。

OKLCH是感知均匀的色彩空间,保持亮度和色度不变,只转变色相角,出来的颜色自然和谐。这个小细节,网页的高级感一下子就上来了。

5. 内容原则:用1000个No换一个Yes

引用乔布斯的话——每个元素都必须证明自己为什么应该在那儿。觉得页面空?用留白解决,不能靠塞东西。一个大胆的留白,比10个凑数的板块更有表现力。

做成OpenClaw Skill

由于Claude Design在国国内使用极其困难(没有API,不能接入自己的工作流),核心能力靠的就是那套泄露的提示词。于是有人(code秘密花园)把核心功能提炼成了一个OpenClaw Skill:web-design-engineer

关键优化:

  • 写代码之前必须先用自然语言说清楚设计系统(配色、字体、间距)
  • 尽早出一个带假设和占位符的最小版本(V0),而不是花几倍时间直接出精雕细琢的V1
  • 补充了更多去AI味的条目
  • 增加了经过验证的字体和配色参考对照表

实测效果:同一套提示词、同一个模型(Claude Opus 4.7),有Skill和没Skill的版本差距非常明显——没用的版本是教科书式的落地页结构,典型的AI霓虹渐变感;用了Skill的版本像一个有经验的设计师的杰作,配色深沉高级,布局有创意。


四、三者的共性:AI工程正在从"调参"走向"造系统"

把这三个话题放在一起看,有一个共同趋势:

AI的能力瓶颈已经不在模型本身,而在模型外面那层"壳"。

  • Harness Engineering告诉你:模型再聪明,没有好的执行编排和验证机制,成功率照样只有70%
  • OpenClaw多智能体告诉你:一个全能Agent不如一组专精Agent,隔离和协作才是正道
  • Claude Design Skill告诉你:同样的模型,一套好的提示词系统可以让输出质量产生质的飞跃

2026年的AI开发者,核心竞争力正在从"会不会调Prompt"变成"能不能造出稳定交付的系统"。


总结

话题 核心结论
Harness Engineering Agent = Model + Harness,模型之外的一切都是Harness
多智能体团队 专精胜于全能,隔离优于共享,像搭团队一样搭Agent
Claude Design Skill 提示词系统工程化,从"一句提示词"到"一套设计体系"

如果你也在做AI应用落地,建议重点关注Harness Engineering的六层架构——它可能会成为2026年AI工程最重要的方法论之一。


参考资料:

《龙虾装上了,可以用来干啥?分享下我的 OpenClaw 多智能体团队搭建经验!》,B站视频,code秘密花园,2026年5月8日。本文通过Ai好记智能解析获取。

《最近爆火的 Harness Engineering 到底是啥?一期讲透!》,B站视频,code秘密花园,2026年5月8日。本文通过Ai好记智能解析获取。

《我把 Claude Design 做成了 Skill,人人都能成为顶级网站设计师》,B站视频,code秘密花园,2026年5月8日。本文通过Ai好记智能解析获取。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐