【Agent Harness】Gliding Horse 设计细节 -- 不跟风开发自己的AI Agent

doiito（Do It Together）

255人浏览 · 2026-06-30 07:20:47

doiito（Do It Together） · 2026-06-30 07:20:47 发布

Gliding Horse Agent OS — 设计细节

摘要：本文深入解析 Gliding Horse Agent OS 的架构设计，涵盖通用化 PDCA 编排、五层记忆架构（受 CPU 缓存启发）、JSON-LD 语义数据总线、5W2H 任务本体、技能图谱自动进化等核心创新。适合 AI 智能体框架开发者、系统架构师及对多智能体协作感兴趣的技术人员阅读。

关键词：Gliding Horse Agent OS AI 智能体框架 PDCA 编排 五层记忆架构 JSON-LD 语义总线 5W2H 任务本体 技能图谱 MESI 缓存一致性 多智能体协作 RDF 知识图谱

1. 通用化 PDCA 编排：超越传统管理

1.1 有何不同？

传统 PDCA（计划-执行-检查-改进）是一种用于流程改进的管理方法论。Gliding Horse Agent OS 实现了通用化计算型 PDCA，它超越了管理范畴，成为一种适应任何复杂度的通用任务执行模型。

1.2 七个任务复杂度级别

系统自动将任务分类为 7 个级别，并相应调整 PDCA 循环：

级别	类型	PDCA 适配	示例
L0	即时任务	单轮，无需 PDCA	“现在几点？”
L1	简单任务	单次 PDCA 循环，最小规划	“写一个 Python 脚本”
L2	标准任务	完整 PDCA + 结构化审计	“分析 Q2 销售数据”
L3	复杂项目	多智能体并行 Do 阶段	“构建 REST API + 测试”
L4	探索型任务	多 DA 并行，不同策略	“研究最佳技术栈”
L5	递归任务	子任务生成子 PDCA 循环	“重构整个代码库”
L6	紧急模式	跳过 Plan，立即 Do-Check 循环	“立即修复生产 Bug”

关键创新：Supervisor Agent (SA) 根据 5W2H 元数据分析动态选择合适的 PDCA 模式，而非僵化的模板。这使得同一个编排引擎既能处理简单的查询，也能处理持续数周的工程项目。

1.3 自适应循环模式

2. 五层记忆架构：CPU 缓存哲学应用于 AI

2.1 受计算机架构启发的革命性设计

与传统智能体框架的扁平上下文窗口不同，Gliding Horse 实现了五层分层记忆系统，直接受 CPU 缓存层级结构（L1/L2/L3 缓存 + RAM + 磁盘存储）启发。

2.2 面向分布式智能体的 MESI 缓存一致性协议

创新：首次将 CPU 缓存一致性协议（MESI：Modified 已修改、Exclusive 独占、Shared 共享、Invalid 无效）应用于多智能体记忆系统。

状态	在智能体上下文中的含义	行为
M（已修改）	节点在 L2 中修改，与 L0 不一致	广播失效到 L1/L3，任务完成时写回
E（独占）	节点加载到 L1，未被共享	快速访问，无一致性开销
S（共享）	节点在多层中缓存，一致	只读共享，适用于读密集型工作负载
I（无效）	引用已过期，必须重新加载	触发"缺页故障"→ 从下层获取

一致性引擎工作流：

DA 修改 L2 黑板中的节点 → 状态变为 M
一致性引擎发送 Invalidate(IRI) 到 L1 → 摘要标记为 I
L3 收到失效通知 → 物化视图移除
下次访问触发从 L0 重新加载更新后的数据

这确保了跨所有智能体实例的强最终一致性，无需昂贵的分布式锁。

2.3 智能预取：扩散激活算法

预取引擎监控智能体意图并主动加载可能需要的知识：

算法：

触发条件：意图切换、实体提及、工具调用返回新链接
扩散：从触发实体出发，在 L3 知识图谱中遍历 1-2 跳
排序：边权重 × 共现频率 → Top-K 实体
执行：异步预加载到 L2"预取区"

结果：知识密集型任务的感知延迟降低 90%。

3. JSON-LD 语义数据总线：通用互操作层

3.1 为什么是 JSON-LD，而不仅仅是 JSON？

大多数智能体框架使用纯 JSON 进行数据交换，导致：

❌ 技能之间的字段名冲突（“input_file” vs “source_url” vs “data_path”）
❌ 缺乏全局实体标识（无法合并来自不同智能体的记忆）
❌ 缺乏语义类型（无法进行多态发现）
❌ 结构固定（无法通过深度控制 Token 预算）

Gliding Horse 使用 JSON-LD 1.1（W3C 标准） 作为通用数据总线，提供六项核心能力：

3.2 @context：面向技能的鸭子类型

不同开发者使用不同的参数名编写技能。JSON-LD @context 将所有变体映射到统一的 IRI：

{
  "@context": {
    "skill": "https://agent-harness.os/skill#",
    "skill:inputMapping": {
      "file_path": { "@id": "skill:sourceDataURI" },
      "source_url": { "@id": "skill:sourceDataURI" },
      "data_path": { "@id": "skill:sourceDataURI" }
    }
  }
}

现在 SA 的工具路由器按语义能力（skill:sourceDataURI）匹配技能，而非根据任意的字段名。这是**“协议级别的鸭子类型”**：如果一个技能声明它能处理 skill:sourceDataURI，无论其内部命名如何，它都是兼容的。

3.3 @id：跨智能体实体对齐

当 DA 写入中间结果而 CA 随后审计时，它们引用相同的 @id：

// DA 写入 L2 黑板
{
  "@id": "blackboard:task-001/east-region-result",
  "@type": "exec:TaskResult",
  "exec:growthRate": "35.2",
  "exec:producedBy": { "@id": "agent:da/inst-003" }
}

// CA 通过相同 @id 查询（无需显式传递）
SELECT ?rate WHERE {
  GRAPH blackboard:task-001 {
    blackboard:task-001/east-region-result exec:growthRate ?rate .
  }
}

RDF 处理器自动合并不同图中具有相同 @id 的节点。这实现了无缝的跨智能体记忆融合，无需去重逻辑。

3.4 @type：多态发现

单个节点可以有多种类型，触发不同的系统行为：

{
  "@id": "blackboard:task-001/result",
  "@type": [
    "exec:TaskResult",      // → CA 审计投影匹配此类型
    "exec:NumericalResult", // → CA 选择数值偏差检测技能
    "sec:Auditable",        // → 所有修改记录到审计追踪
    "mon:HighPriority"      // → SA 态势感知标记为红色，缩短检查周期
  ]
}

SPARQL 多态查询：

SELECT ?skill WHERE {
  ?skill a ?skillType .
  FILTER(?skillType IN (skill:NumericalProcessor, skill:TabularProcessor))
}

这实现了多维分类，无需复杂的继承层级。

3.5 嵌套 vs IRI 引用：物理 Token 预算控制

相同的 RDF 图可以表示为完全展开（高 Token 成本）或仅 IRI 指针（最小 Token）：

// 深度展开（适用于活跃子任务，约 1500 tokens）
{
  "@id": "task:sales-analysis",
  "task:subTasks": {
    "@embed": "@always",
    "exec:status": "completed",
    "exec:result": { "value": 35.2 }
  }
}

// 浅引用（适用于历史数据，约 50 tokens）
{
  "@id": "task:sales-analysis",
  "task:relatedHistory": {
    "@embed": "@link",
    "@id": "task:q1-analysis-2025"
  }
}

SA 的智能掐断决策：

活跃子任务 → 深度展开（为智能体提供完整上下文）
历史背景 → 仅 IRI（缺页时加载）
已完成监控 → 摘要投影（仅摘要）

这使得 L1 上下文窗口保持在预算内，同时保持完整的知识可达性。

3.6 @graph 命名图：无冲突并行写入

每个智能体实例拥有自己的命名图，实现无锁并行写入：

访问权限矩阵：

图名称	SA	PA	DA	CA	AA
`blackboard:shared`	读写	读	读写	读写	读
`blackboard:task-{id}`	读写	读	读写	读	读
`agent:{id}`	读	—	—	—	—
`system:audit-log`	读	—	—	—	—

当冲突发生时（DA 说"已完成"，CA 说"失败"），SA 回溯到源图进行仲裁。

3.7 JSON-LD Framing：按需投影

L3 投影引擎使用 Frame 文档声明所需的输出形状：

{
  "@context": { "exec": "https://agent-harness.os/exec#" },
  "@type": "task:AnalysisTask",
  "task:subTasks": {
    "@embed": "@always",           // 完全展开
    "exec:assignedTo": { "@embed": "@link" }  // 仅 IRI
  },
  "task:relatedHistory": {
    "@embed": "@link"              // 历史记录作为指针
  }
}

五级渐进式信息披露：

级别	内容	Token	用户
L1	MOC 索引扫描（名称 + 计数）	~200	SA 初始分析
L2	技能 5W2H 摘要（what/why/when）	~500	SA 技能匹配
L3	链接关系（前置条件）	~800	SA/PA 链式发现
L4	模式 + 步骤列表	~1500	DA 工具调用
L5	完整内容（代码 + 验证）	按需	DA 执行 / CA 审计

这确保每个智能体只看到它需要的、不多也不少。

3.8 简化的 JSON-LD 使用：连接 LLM 与知识图谱

挑战：LLM 不擅长生成复杂的 JSON-LD 结构。它们擅长生成自然语言和简单的 JSON 对象。

我们的解决方案：一种混合方法，利用两种范式的优势：

LLM 响应结构（针对多轮对话优化）：

{
  "think": "Analyzing user request for database schema design...",
  "content": "CREATE TABLE users (id UUID PRIMARY KEY, email VARCHAR(255) UNIQUE NOT NULL);",
  "summary": "Database schema for user table with UUID primary key and unique email constraint"
}

为什么采用三字段结构？

字段	用途	Token 效率
think	思维链推理（轮次后丢弃）	临时，不归档
content	完整详细输出（归档至 L0 以追溯）	完整保真度
summary	简洁摘要（保留在 L1 上下文窗口中）	相比完整内容节省约 90% Token

多轮对话优化：

第 1 轮：用户要求设计数据库模式
  → LLM 生成 think/content/summary
  → summary 追加到 L1 上下文（约 50 tokens）
  → content 以 @id: "memory:session-001/block-042" 归档至 L0

第 2 轮：用户问"我们创建了哪些表？"
  → L1 上下文包含摘要："Database schema for user table..."
  → 如需详情，AgentRunner 从 L0 解析 IRI "memory:session-001/block-042"
  → 结果：L1 保持小巧，信息无丢失

AgentRunner 与 L2 黑板的角色：

AgentRunner（通过 L2 黑板）充当了以下两者之间的翻译层：

LLM 的舒适区：包含 think/content/summary 的简单 JSON
系统的需求：包含 @id、@type、@context 的 JSON-LD，用于互操作

处理流程：

// 说明转换过程的伪代码
let llm_output = llm_client.generate(prompt).await?; // 返回简单 JSON

// 步骤 1：按 JSON Schema 验证
validation_engine.validate(&llm_output.content, &skill.input_schema)?;

// 步骤 2：转换为 JSON-LD 节点
let jsonld_node = json!({
    "@id": format!("memory:{}/block-{}", session_id, block_counter),
    "@type": ["mem:MemoryBlock", "exec:TaskResult"],
    "mem:content": llm_output.content,
    "mem:summary": llm_output.summary,
    "mem:embedding": embedding_service.index(&llm_output.content).await?
});

// Step 3: Write to L2 blackboard (Oxigraph in-memory)
l2_manager.insert_node(&jsonld_node)?;

// Step 4: Schedule batch write-back to L0
scheduler.schedule_writeback(session_id, block_counter);

此设计实现了：

✅ 性能：L2 内存查询延迟 ~2ms
✅ 可扩展性：L0 磁盘存储，容量无限
✅ Token 经济性：基于摘要的 L1 上下文，Token 使用最小化
✅ 可追溯性：完整内容保留于 L0，带有 IRI 引用
✅ 互操作性：JSON-LD 支持跨智能体数据共享

4. 5W2H 任务本体：结构化意图建模

4.1 为什么是 5W2H：通用任务本体

所有结构化思维的基础

Gliding Horse Agent OS 建立在两个通用框架之上，它们是处理任何任务的基础：

5W2H（What-做什么、Why-为什么、Who-谁做、When-何时、Where-何地、How-怎么做、How Much-多少资源） — 任务本体
- 回答：“到底需要做什么？”
- 目的：明确意图、约束和成功标准
- 时机：在任务初始化阶段应用
PDCA 循环（Plan-计划、Do-执行、Check-检查、Act-改进） — 执行模型
- 回答：“我们如何系统地执行和改进？”
- 目的：提供带持续反馈的迭代执行
- 时机：贯穿任务生命周期

为什么两者缺一不可：

任何可执行任务 = 5W2H（意图清晰度）+ PDCA（系统性执行）

框架	角色	缺少它会怎样
5W2H	定义做什么	目标模糊 → 期望偏离
PDCA	定义如何迭代执行	混乱实施 → 缺乏质量控制

完整工作流：

4.2 超越自由文本提示

传统智能体接受非结构化提示，导致目标模糊和执行不可审计。Gliding Horse 引入 5W2H 任务本体作为所有非平凡任务的标准化元数据框架。

4.3 渐进式填充生命周期

每个维度都有一个 fillStage 属性，标记其应在何时填充：

示例生命周期：

// 阶段 1：创建（SA 提取最小集）
{
  "@id": "task:sales-q2-analysis",
  "task:5W2H": {
    "what": "分析 Q2 区域销售数据并生成预测报告",
    "why": {
      "description": "为库存规划提供依据",
      "successCriteria": ["输出包含区域增长对比和预测的可视化"],
      "priority": "high"
    },
    "who": { "requestor": "user:vp-sales", "requiredRole": "agent:Do" },
    "when": { "deadline": "2026-05-20T18:00:00+08:00" }
  }
}

// 阶段 2：规划（PA 补全 How/Where）
{
  "task:5W2H": {
    "where": {
      "dataSources": ["file://data/sales_q2.csv", "db://crm/deals"],
      "executionEnvironment": "sandbox"
    },
    "how": {
      "planIRI": "plan:task-tree/sales-q2",
      "preferredSkills": ["skill:python-analysis", "skill:forecasting"],
      "requiredSteps": "1. 数据清洗 → 2. 区域分组 → 3. 预测建模 → 4. 报告生成"
    }
  }
}

// 阶段 3：审计（CA 填充实际 HowMuch）
{
  "task:5W2H": {
    "howMuch": {
      "tokenBudget": 5000,
      "actualCost": 5600,
      "maxPDCACycles": 3,
      "actualCycles": 2
    }
  }
}

4.4 维度级结构化审计

CA 不只说"通过/不通过"。它独立审计每个 5W2H 维度：

{
  "auditBy5W2H": {
    "what": { "verdict": "PASS", "evidence": "已生成包含区域对比和预测的报告" },
    "why": { "verdict": "PASS", "evidence": "结论可直接用于库存规划" },
    "when": { "verdict": "PASS", "evidence": "于 5/19 14:00 交付，在截止日期前" },
    "where": { "verdict": "PASS", "evidence": "数据源匹配，沙箱环境安全" },
    "how": { "verdict": "PASS", "evidence": "全部四个步骤按计划完成" },
    "howMuch": { "verdict": "WARNING", "evidence": "Token 超出 12%，但结果质量高" }
  },
  "overallVerdict": "CONDITIONAL_PASS"
}

然后 AA 做出维度感知的决策：

What/Why 失败 → 回滚至 SA 重新分析
How/Where 失败 → 回滚至 PA 修正计划
When/HowMuch 失败 → 如有理由则通过；否则降级或终止

4.5 模式识别：5W2H 驱动的经验复用

L0 存储所有已完成的任务作为冻结的 task:CompletedTaskSnapshot。SA 的模式识别器官查询类似经验：

PREFIX task: <https://agent-harness.os/task#>

SELECT ?pastTask ?whySimilarity ?howSimilarity
WHERE {
  GRAPH system:experience {
    ?pastTask a task:CompletedTaskSnapshot .
    ?pastTask task:5W2H/task:why ?pastWhy .
    ?pastTask task:5W2H/task:how/task:planIRI ?pastPlan .
    BIND(external:cosineSimilarity(?currentWhyVec, ?pastWhyVec) AS ?whySimilarity)
  }
  FILTER(?whySimilarity > 0.85)
}
ORDER BY DESC(?whySimilarity)
LIMIT 5

匹配的历史 5W2H 子图被注入 SA 决策上下文：

推荐相同的 task:how/preferredSkills
警告历史 task:where 陷阱（如不稳定分支）
提供历史 task:howMuch/actualCost 作为预算参考

5. 技能图谱：具有自动进化能力的认知知识网络

5.1 超越静态技能库

传统智能体框架将技能视为静态函数库。Gliding Horse 实现了动态认知知识网络，其中技能通过使用而进化，积累经验片段，并通过语义链接自组织。

5.2 六种语义链接类型

技能通过六种关系类型连接，每种触发不同的 SA 推理行为：

链接类型	SA 推理行为	示例
`PrerequisiteLink`（前置依赖）	选择 A 时自动包含技能 B	JWT 认证 → 自动加载 Rust 基础
`CompositionLink`（组合）	递归展开子技能 / MOC 导航	MOC 认证域 → 展开 JWT/OAuth2/Token
`RelatedLink`（关联）	完成 A 后推荐 B	完成 JWT 实现 → 建议中间件集成
`AlternativeLink`（替代）	A 不可用时自动切换至 B	Rust 环境不可用 → 切换到 Node.js 版本
`ExtendsLink`（扩展）	基础功能选 A，高级功能选 B	基础 JWT → OAuth2 完整授权
`GeneralizationLink`（泛化）	将特定任务映射到通用模板	销售预测 → 时间序列预测

SPARQL 属性路径递归发现最深 3 层的依赖链：

?target (skill:links/skill:target){0,3} ?chainNode .

5.3 AA 驱动的自动进化

每次任务完成后，AA 分析执行轨迹并进化技能图谱：

示例：CA 发现 JWT 密钥轮换导致大量用户登出。AA 创建一个 KnowledgeFragment：

{
  "@id": "skill:fragment/jwt-key-rotation-pitfall",
  "@type": "skill:KnowledgeFragment",
  "schema:name": "JWT 密钥轮换陷阱",
  "skill:attachedTo": "skill:rust-jwt-auth",
  "skill:content": {
    "problem": "轮换期间直接替换旧密钥会使所有已签发令牌失效",
    "recommendation": "使用 JWKS 端点同时发布多个公钥，实现平滑过渡",
    "alternativeSkill": "skill:jwks-implementation"
  }
}

未来的 SA 在处理 JWT 任务时将看到此片段并推荐 JWKS 方法。

5.4 自引导：/learn 和 /reduce 机制

当 DA 遇到无可利用技能的问题时：

这实现了无需人工干预的自主技能获取。
这实现了无需人工干预的自主技能获取。

下面是一个具体的代码示例，展示当 DA 遇到无可利用技能时，AgentRunner 如何触发 /learn 流程，并生成一个包含 5W2H 元数据的新技能节点 JSON-LD 片段：

// AgentRunner 检测到 DA 报告无可用技能后，触发 /learn 流程
async fn handle_skill_miss(
    agent_runner: &AgentRunner,
    da_report: &DaSkillMissReport,
) -> Result<SkillNode, AgentError> {
    // 步骤 1：SA 分析问题特征，生成 5W2H 草案
    let five_w2h = FiveW2HDraft {
        what: da_report.task_description.clone(),
        why: WhyDraft {
            description: format!(
                "DA 在任务 '{}' 中遇到无可用技能，需自动创建新技能",
                da_report.task_id
            ),
            success_criteria: vec![
                "新技能可处理当前任务".into(),
                "技能元数据完整可复用".into(),
            ],
            priority: Priority::High,
        },
        who: WhoDraft {
            requestor: format!("agent:da/{}", da_report.da_instance_id),
            required_role: "agent:Do".into(),
        },
        when: WhenDraft {
            deadline: Utc::now() + Duration::hours(1),
        },
        how: HowDraft {
            plan_iri: None,
            preferred_skills: vec![],
            required_steps: vec![
                "分析任务特征".into(),
                "生成技能实现".into(),
                "验证技能可用性".into(),
            ],
        },
        where_: WhereDraft {
            data_sources: da_report.context_sources.clone(),
            execution_environment: "sandbox".into(),
        },
        how_much: HowMuchDraft {
            token_budget: 8000,
            max_cycles: 3,
        },
    };

    // 步骤 2：SA 创建 Skill 节点（状态: draft），生成 JSON-LD 片段
    let skill_node = json!({
        "@context": {
            "skill": "https://agent-harness.os/skill#",
            "task": "https://agent-harness.os/task#",
            "schema": "https://schema.org/",
            "xsd": "http://www.w3.org/2001/XMLSchema#"
        },
        "@id": format!("skill:auto/{}", uuid::Uuid::new_v4()),
        "@type": ["skill:AtomicSkill", "skill:AutoGenerated"],
        "schema:name": format!("auto-{}", da_report.task_type),
        "schema:description": format!(
            "由 AgentRunner 自动生成，用于处理 '{}' 类型任务",
            da_report.task_type
        ),
        "skill:status": "draft",
        "skill:createdAt": {
            "@type": "xsd:dateTime",
            "@value": Utc::now().to_rfc3339()
        },
        "skill:5W2H": {
            "task:what": five_w2h.what,
            "task:why": {
                "task:description": five_w2h.why.description,
                "task:successCriteria": five_w2h.why.success_criteria,
                "task:priority": five_w2h.why.priority
            },
            "task:who": {
                "task:requestor": five_w2h.who.requestor,
                "task:requiredRole": five_w2h.who.required_role
            },
            "task:when": {
                "task:deadline": five_w2h.when.deadline.to_rfc3339()
            },
            "task:how": {
                "task:requiredSteps": five_w2h.how.required_steps
            },
            "task:where": {
                "task:dataSources": five_w2h.where_.data_sources,
                "task:executionEnvironment": five_w2h.where_.execution_environment
            },
            "task:howMuch": {
                "task:tokenBudget": five_w2h.how_much.token_budget,
                "task:maxCycles": five_w2h.how_much.max_cycles
            }
        },
        "skill:triggeredBy": {
            "@id": format!("agent:da/{}", da_report.da_instance_id),
            "@type": "agent:DoAgent"
        },
        "skill:sourceTask": {
            "@id": format!("task:{}", da_report.task_id),
            "@type": "task:Task"
        },
        "skill:links": [
            {
                "@type": "skill:RelatedLink",
                "skill:target": {
                    "@id": "moc:auto-generated-skills",
                    "@type": "skill:MOC"
                },
                "skill:relationType": "belongsTo"
            }
        ]
    });

    // 步骤 3：写入 L0 持久存储
    let skill_id = agent_runner
        .l0_manager
        .insert_node(&skill_node)
        .await?;

    // 步骤 4：建立与相关 MOC 的链接
    agent_runner
        .skill_graph
        .add_link(
            &skill_id,
            "moc:auto-generated-skills",
            LinkType::CompositionLink,
        )
        .await?;

    Ok(SkillNode {
        id: skill_id,
        node: skill_node,
        status: SkillStatus::Draft,
    })
}

上述代码展示了 /learn 流程的核心逻辑：

SA 分析问题特征：从 DA 报告中提取任务描述，生成完整的 5W2H 元数据草案
创建 JSON-LD 技能节点：包含 @context、@id、@type、schema:name、skill:5W2H 等字段，其中 5W2H 覆盖了 What/Why/Who/When/How/Where/HowMuch 全部七个维度
持久化与链接：将新技能节点写入 L0 存储，并建立与 moc:auto-generated-skills 的组合链接，使其可被后续任务发现

当 /reduce 阶段 DA 返回解决方案后，SA 会提取该方案填充到技能节点的 skill:content 和 skill:steps 字段，并将状态从 draft 更新为 active，完成完整的自引导闭环。

6. 主动感知引擎：异常检测与智能干预

6.1 十大感知触发器

ProactiveEngine 通过十个不同的触发器监控执行，每个映射到特定的干预计划：

6.2 异常去重

基于时间窗口的过滤防止告警风暴：

perception:
  anomaly_dedup_window_seconds: 60  # 60 秒内抑制重复告警
  simple_input_threshold: 50         # 输入 < 50 字符 → 简单任务
  medium_input_threshold: 200        # 输入 < 200 字符 → 中等复杂度
  cycle_timeout_secs: 300            # 循环超过 5 分钟则告警
  max_iterations_before_alert: 10    # 10 轮无进展则告警
  error_rate_threshold: 0.5          # 超过 50% 工具调用失败则告警

6.3 5W2H 约束检查

ProactiveEngine 根据 5W2H 约束验证执行：

截止时间违规：当前时间 > task:when/deadline → 升级到人工处理
预算超支：Token 消耗 > task:howMuch/tokenBudget × 0.8 → 警告 SA
角色不匹配：分配的智能体角色 ≠ task:who/requiredRole → 重新分配
环境冲突：两个任务修改同一仓库/分支 → 串行执行

7. 高级工具执行框架

7.1 内置工具（25+）与微工具系统

类别	工具	创新点
文件操作	`file_read`, `file_write`, `file_edit`, `file_list`, `glob_search`, `grep_search`	符号链接检测，路径遍历防护
网络	`WebFetch`, `WebSearch`（DuckDuckGo 回退链）	TLS 强制，代理支持
执行	`Bash`, `PowerShell`（沙箱化 + 超时）	可配置超时，受限路径

微工具创新：对于大型工具结果（>8KB），系统自动生成可对话的微工具：

// 在 file_read 返回 50KB 内容后
微工具: "search_in_results" 
描述: "在之前读取的文件内容中搜索"
参数: { "query": "string", "context_lines": "number" }

这将笨重的输出转变为可交互查询的产物。

7.2 Model Context Protocol (MCP) 集成

通过 MCP 标准集成外部工具服务器：

连接到远程工具提供方（GitHub、Slack、Jira 等）
运行时动态发现工具
带 API 密钥轮换的安全认证

8. 检查点与恢复：容错执行

会话状态持久化支持从崩溃中恢复：

// 在关键点创建检查点
let checkpoint_id = checkpoint_manager.create(
    &task_iri,
    &format!("cycle:{}", cycle_id),
    &state_json,
    &metadata_json,
    &context_json,
    &artifacts
)?;

// 崩溃后恢复
let restored_state = checkpoint_manager.restore(&task_iri)?;

使用场景：

长时间运行的任务恢复（数小时/数天）
智能体重启而不丢失上下文
事后分析和回放调试

9. 工作任务队列：后台作业处理

用于异步操作的持久化队列：

技术：yaque（Yet Another Queue）+ bincode 序列化
特性：磁盘持久化、确认确认、窥视操作
使用场景：
- 批量知识导入（数千文档）
- 定时技能进化（夜间优化）
- 定期清理（过期缓存条目）
- 异步嵌入生成

10. 模板引擎与 JSON Schema 验证

10.1 基于 Markdown 的提示模板

## 角色: {{agent_role}}
## 任务: {{task_description}}

### 上下文
{{l3_projection}}

### 可用技能
{{skill_list}}

### 5W2H 约束
- What: {{what}}
- Why: {{why}}
- When: {{deadline}}
- How Much: {{token_budget}}

### 指令
...

特性：

递归目录扫描
变量插值（{placeholder} 语法）
模板继承（通过 include）
版本控制于 Git 中

10.2 一次往返，双重收获

高级验证模式，在单次 LLM 调用中同时提取元数据并转换为 JSON-LD：

// LLM 输出
{
  "thought": "正在规划数据库模式...",
  "content": "CREATE TABLE users...",
  "summary": "数据库模式设计完成",
  "metadata": {
    "tables": ["users", "orders"],
    "relationships": ["one-to-many"]
  }
}

// 系统处理：
// 1. 按 JSON Schema 验证 metadata
// 2. 将验证后的 metadata 转换为 JSON-LD 节点
// 3. 以 @id 写入 L2 黑板
// 结果：单次 LLM 调用 → 验证后的结构化数据 + 自然语言

这使信息提取效率比传统单一用途提示提高一倍。

11. 架构

11.1 系统组件

11.2 数据流：现代流马在行动

本文档聚焦于 Gliding Horse Agent OS 的架构设计和系统创新。有关快速入门指南、应用展示和项目概述，请参阅 README.md 或 README.zh.md。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

【AI战国时代】国内大厂互联网技术开源贡献格局与 AI Agent 时代趋势分析

龙虾开发者社区

OpenAI 与 Claude 对于 Data Agent 的设计差异与方法论比较

OpenAI和Anthropic在企业Data Agent设计上存在方法论差异：核心关注点：OpenAI侧重通过多层上下文增强Agent对企业数据的理解能力，而Claude更注重通过治理闭环确保数据使用的可信路径。架构设计：OpenAI采用六层上下文系统（表结构、人工注释、代码解析等），Claude则构建四层治理架构（数据模型、语义层、Skills流程等）。流程控制：OpenAI强调Agen

龙虾开发者社区

谁才是2026年最强的“车机大脑”？

而商*绝影则扮演了“技术赋能者”的角色，它不造车，而是通过OpenClaw开放协议和“可悠”终端，将顶尖的AI能力注入到东风、长城等各大车企中，走的是开放连接的联盟路线。在2026年的智能汽车市场，智能座舱的竞争早已脱离了单纯的“屏幕大小”和“应用数量”，全面进入了“AI大脑”的较量。它拥有独立的车载实体机器人，搭载双关节自由度的静音电机，不仅能实现340°的精细旋转，还能根据对话内容做出点头、摇

龙虾开发者社区

所有评论(0)

查看更多评论

doiito（Do It Together）

@2604_96270735

已为社区贡献11条内容

【Agent Harness】Gliding Horse 设计细节 -- 不跟风开发自己的AI Agent

doiito（Do It Together）

Gliding Horse Agent OS — 设计细节

1. 通用化 PDCA 编排：超越传统管理

1.1 有何不同？

1.2 七个任务复杂度级别

1.3 自适应循环模式

2. 五层记忆架构：CPU 缓存哲学应用于 AI

2.1 受计算机架构启发的革命性设计

2.2 面向分布式智能体的 MESI 缓存一致性协议

2.3 智能预取：扩散激活算法

3. JSON-LD 语义数据总线：通用互操作层

3.1 为什么是 JSON-LD，而不仅仅是 JSON？

3.2 @context：面向技能的鸭子类型

3.3 @id：跨智能体实体对齐

3.4 @type：多态发现

3.5 嵌套 vs IRI 引用：物理 Token 预算控制

3.6 @graph 命名图：无冲突并行写入

3.7 JSON-LD Framing：按需投影

3.8 简化的 JSON-LD 使用：连接 LLM 与知识图谱

4. 5W2H 任务本体：结构化意图建模

4.1 为什么是 5W2H：通用任务本体

4.2 超越自由文本提示

4.3 渐进式填充生命周期

4.4 维度级结构化审计

4.5 模式识别：5W2H 驱动的经验复用

5. 技能图谱：具有自动进化能力的认知知识网络

5.1 超越静态技能库

5.2 六种语义链接类型

5.3 AA 驱动的自动进化

5.4 自引导：/learn 和 /reduce 机制

6. 主动感知引擎：异常检测与智能干预

6.1 十大感知触发器

6.2 异常去重

6.3 5W2H 约束检查

7. 高级工具执行框架

7.1 内置工具（25+）与微工具系统

7.2 Model Context Protocol (MCP) 集成

8. 检查点与恢复：容错执行

9. 工作任务队列：后台作业处理

10. 模板引擎与 JSON Schema 验证

10.1 基于 Markdown 的提示模板

10.2 一次往返，双重收获

11. 架构

11.1 系统组件

11.2 数据流：现代流马在行动

所有评论(0)

温馨提示：您尚未绑定手机号

doiito（Do It Together）