【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
核心设计理念:5W2H、JSON-LD 与通用知识图谱
摘要:本文深入解析 Gliding Horse Agent OS 的核心设计理念,阐述如何通过 5W2H 任务本体与 PDCA 执行模型的结合,构建可执行、可审计、可进化的通用工作框架。文章详细介绍了 JSON-LD 简化用法、Harness 引擎的 LLM↔知识图谱翻译机制,以及统一知识图谱如何将技能、记忆、任务和代码知识融为一体。适合对 AI Agent 架构、语义网、知识图谱与多智能体系统感兴趣的开发者与架构师阅读。
关键词:5W2H, PDCA, JSON-LD, 知识图谱, Agent OS, 多智能体系统, 语义网, 任务本体, 技能图谱, 上下文压缩, 缺页故障, Oxigraph, Harness 引擎, 自进化架构, 统一语义总线
1. 为什么是 5W2H + PDCA:所有可执行工作的通用框架
1.1 结构化执行的两大支柱
Gliding Horse Agent OS 建立在两个通用框架之上,它们是处理任何任务的基础:
-
5W2H(What-做什么、Why-为什么、Who-谁做、When-何时、Where-何地、How-怎么做、How Much-多少资源) — 任务本体
- 回答:“到底需要做什么?”
- 目的:明确意图、约束和成功标准
- 时机:在任务初始化阶段应用
-
PDCA 循环(Plan-计划、Do-执行、Check-检查、Act-改进) — 执行模型
- 回答:“我们如何系统地执行和改进?”
- 目的:提供带持续反馈的迭代执行
- 时机:贯穿任务生命周期
为什么两者缺一不可:
任何可执行任务 = 5W2H(意图清晰度)+ PDCA(系统性执行)
| 框架 | 角色 | 缺少它会怎样 |
|---|---|---|
| 5W2H | 定义做什么 | 目标模糊 → 期望偏离 |
| PDCA | 定义如何迭代执行 | 混乱实施 → 缺乏质量控制 |
完整工作流:
1.2 5W2H:任务本体
5W2H 捕捉了任何可执行工作的完整本质。如果你无法清晰阐述所有 7 个维度,任务本质上是不可执行的。
为什么 5W2H 不可替代:
| 维度 | 回答的问题 | 缺失的后果 |
|---|---|---|
| What(做什么) | 需要做什么? | 无清晰目标 → 盲目执行 |
| Why(为什么) | 为什么重要? | 无动机/优先级 → 低参与度 |
| Who(谁做) | 谁负责? | 问责缺失 → 无人负责 |
| When(何时) | 必须何时完成? | 无截止日期 → 永远拖延 |
| Where(何地) | 在哪里执行? | 上下文模糊 → 错误环境 |
| How(怎么做) | 如何执行? | 无方法 → 混乱实施 |
| How Much(多少资源) | 可用资源? | 预算超支 → 项目失败 |
任一维度的模糊性都会导致:
- 干系人之间的期望不一致
- 资源配置不当(时间、预算、人员)
- 无法衡量成功或失败
- 审计失败和问责缺失
1.3 PDCA:通用化执行模型
与传统管理型 PDCA 不同,Gliding Horse 实现了通用化计算型 PDCA,能够适应任务复杂度:
七个复杂度级别:
| 级别 | 类型 | PDCA 适配 | 示例 |
|---|---|---|---|
| L0 | 即时任务 | 单轮,无需 PDCA | “现在几点?” |
| L1 | 简单任务 | 单次 PDCA 循环 | “写一个 Python 脚本” |
| L2 | 标准任务 | 完整 PDCA + 结构化审计 | “分析 Q2 销售数据” |
| L3 | 复杂项目 | 多智能体并行 Do 阶段 | “构建 REST API + 测试” |
| L4 | 探索型任务 | 多 DA 并行,不同策略 | “研究最佳技术栈” |
| L5 | 递归任务 | 子任务生成子 PDCA 循环 | “重构整个代码库” |
| L6 | 紧急模式 | 跳过 Plan,立即 Do-Check | “立即修复生产 Bug” |
关键创新:Supervisor Agent 根据 5W2H 元数据分析动态选择合适的 PDCA 模式,而非僵化的模板。这使得同一个编排引擎既能处理简单的查询,也能处理持续数周的工程项目。
1.4 专业模型作为技能扩展
在 Gliding Horse Agent OS 中,SWOT、5 Whys、SMART 等专业模型被实现为技能图谱系统中的可复用技能。当 5W2H 元数据表明适用时,它们被调用:
{
"task:5W2H": {
"what": "分析市场竞争",
"why": "识别战略定位机会",
"how": {
"preferredSkills": ["skill:swot-analysis", "skill:porter-five-forces"]
}
}
}
此设计确保:
- 一致性:每个任务都有相同的结构基础(5W2H + PDCA)
- 可扩展性:专业分析方法作为可插拔技能
- 可审计性:CA 可独立验证每个维度
- 模式识别:具有类似 5W2H 配置的历史任务触发相关技能推荐
2. JSON-LD 简化用法:连接 LLM 与知识图谱
2.1 挑战
LLM 不擅长生成复杂的 JSON-LD 结构。它们擅长生成自然语言和简单的 JSON 对象。然而,系统需要 JSON-LD 来实现:
- 全局实体标识(
@id) - 语义类型(
@type) - 字段名规范化(
@context) - 深度控制以管理 Token 预算
2.2 我们的解决方案:Harness 引擎混合方案
我们使用一个翻译层(Harness Engine),将简单的 LLM 输出转换为 JSON-LD 节点:
2.3 LLM 响应结构(针对存储效率优化)
{
"think": "Analyzing user request for database schema design...",
"contents": "CREATE TABLE users (id UUID PRIMARY KEY, email VARCHAR(255) UNIQUE NOT NULL);",
"summary": "Database schema for user table with UUID primary key and unique email constraint"
}
为什么采用三字段结构?
| 字段 | 用途 | 存储策略 | 检索模式 |
|---|---|---|---|
| think | 思维链推理 | 归档至 L0 | 调试 / 可追溯性 |
| contents | 完整详细输出 | 归档至 L0 | 缺页故障时加载 |
| summary | 简洁摘要 | 索引至 L2 | 快速上下文概览 |
存储与检索机制:
步骤 1: LLM 生成 think/contents/summary
→ 三个字段均以 @id: "memory:session-001/block-042" 归档至 L0
→ summary 同时在 L2 中建立索引以快速访问
步骤 2: Agent 需要下一轮上下文
→ L2 返回 summary(~50 tokens)作为轻量级上下文
→ L1 上下文窗口保持小巧
步骤 3: 用户要求查看详情("显示完整的 SQL")
→ 系统检测到需要完整内容
→ 触发"缺页故障":通过 IRI 引用从 L0 加载 contents
→ 返回完整 SQL 语句
结果:L1/L2 保持精简,L0 保存全保真,通过 IRI 按需加载
类比 CPU 虚拟内存:
| 概念 | CPU 架构 | Gliding Horse 内存 |
|---|---|---|
| 工作集 | RAM(快速、有限) | L2 Oxigraph(快速,~2ms) |
| 页表 | 虚拟→物理映射 | IRI 引用 |
| 缺页故障 | 磁盘 → RAM 加载 | L0 → L2 加载 |
| 交换空间 | 磁盘存储 | L0 redb + HyperspaceEngine |
此设计实现了:
- ✅ 性能:L2 内存查询延迟 ~2ms
- ✅ 可扩展性:L0 磁盘存储,容量无限
- ✅ Token 经济性:基于摘要的 L1/L2 上下文,Token 使用最小化
- ✅ 可追溯性:think/contents 完整保留于 L0 供调试
- ✅ 互操作性:JSON-LD 支持跨智能体数据共享
2.4 Harness 引擎的角色
Harness 引擎充当了以下两者之间的翻译层:
- LLM 的舒适区:包含 think/contents/summary 的简单 JSON
- 系统的需求:包含 @id、@type、@context 的 JSON-LD,用于互操作
处理流程:
// 说明转换过程的伪代码
let llm_output = llm_client.generate(prompt).await?; // 返回简单 JSON
// 步骤 1:按 JSON Schema 验证
validation_engine.validate(&llm_output.contents, &skill.input_schema)?;
// 步骤 2:转换为 JSON-LD 节点
let jsonld_node = json!({
"@id": format!("memory:{}/block-{}", session_id, block_counter),
"@type": ["mem:MemoryBlock", "exec:TaskResult"],
"mem:think": llm_output.think,
"mem:contents": llm_output.contents,
"mem:summary": llm_output.summary,
"mem:embedding": embedding_service.index(&llm_output.contents).await?
});
// 步骤 3:写入 L0 持久存储(全保真归档)
l0_manager.insert_node(&jsonld_node)?;
// 步骤 4:在 L2 中建立摘要索引以便快速访问
l2_manager.index_summary(&jsonld_node["@id"], &llm_output.summary)?;
此设计分离了关注点:
- L0:全保真归档(think + contents + summary)
- L2:快速访问工作集(summary + 元数据)
- L1:活跃上下文窗口(仅摘要,受 Token 约束)
2.5 实战代码示例:Python 调用 Harness 引擎
下面是一个完整的 Python 示例,展示如何将 LLM 的简单 JSON 输出转换为符合系统规范的 JSON-LD 节点,并写入存储层。代码包含详细的注释和错误处理。
"""
harness_client.py — Gliding Horse Harness 引擎 Python 客户端示例
功能:接收 LLM 的 think/contents/summary 输出,转换为 JSON-LD 节点,
执行 Schema 校验,并写入 L0 持久存储与 L2 索引。
"""
import json
import uuid
import hashlib
import logging
from datetime import datetime, timezone
from typing import Optional, TypedDict
# 配置日志
logging.basicConfig(level=logging.INFO, format="%(asctime)s [%(levelname)s] %(message)s")
logger = logging.getLogger(__name__)
# ──────────────────────────────────────────────
# 1. 类型定义
# ──────────────────────────────────────────────
class LLMOutput(TypedDict, total=False):
"""LLM 输出的标准三字段结构"""
think: str # 思维链推理过程
contents: str # 完整详细输出
summary: str # 简洁摘要(用于 L2 索引)
class JSONLDNode(TypedDict, total=False):
"""转换后的 JSON-LD 节点"""
"@id": str
"@type": list[str]
"@context": dict
"mem:think": str
"mem:contents": str
"mem:summary": str
"mem:embedding": Optional[list[float]]
"mem:createdAt": str
# ──────────────────────────────────────────────
# 2. Schema 校验器
# ──────────────────────────────────────────────
class SchemaValidator:
"""
模拟 JSON Schema 校验器。
生产环境可替换为 jsonschema 库或 SHACL 引擎。
"""
REQUIRED_FIELDS = {"think", "contents", "summary"}
@classmethod
def validate(cls, data: dict, schema_name: str = "default") -> bool:
"""
校验 LLM 输出是否符合基本 Schema。
Args:
data: LLM 输出的字典
schema_name: Schema 名称(预留扩展)
Returns:
True 通过校验,否则抛出 ValueError
Raises:
ValueError: 缺少必填字段或字段类型错误
"""
# 检查必填字段
missing = cls.REQUIRED_FIELDS - set(data.keys())
if missing:
raise ValueError(f"Schema 校验失败,缺少字段: {missing}")
# 检查字段类型
for field in cls.REQUIRED_FIELDS:
if not isinstance(data.get(field), str):
raise ValueError(
f"Schema 校验失败,字段 '{field}' 应为字符串,"
f"实际类型: {type(data.get(field)).__name__}"
)
# 检查字段长度(防止空字符串)
for field in cls.REQUIRED_FIELDS:
if not data[field].strip():
raise ValueError(f"Schema 校验失败,字段 '{field}' 为空")
logger.info("Schema 校验通过 (schema=%s)", schema_name)
return True
# ──────────────────────────────────────────────
# 3. 嵌入服务(模拟)
# ──────────────────────────────────────────────
class EmbeddingService:
"""模拟向量嵌入服务,生产环境可替换为 OpenAI/text2vec 等"""
@staticmethod
async def index(text: str) -> list[float]:
"""
生成文本的向量嵌入。
此处用文本的 SHA-256 哈希的前 16 字节模拟嵌入向量,
仅作演示用途。生产环境应调用真实的嵌入模型。
"""
hash_bytes = hashlib.sha256(text.encode("utf-8")).digest()[:16]
embedding = [b / 255.0 for b in hash_bytes] # 归一化到 [0, 1]
logger.debug("生成嵌入向量,维度=%d", len(embedding))
return embedding
# ──────────────────────────────────────────────
# 4. 存储管理器(模拟)
# ──────────────────────────────────────────────
class L0StorageManager:
"""模拟 L0 持久存储(redb KV + HyperspaceEngine)"""
def __init__(self):
self._store: dict[str, dict] = {}
async def insert_node(self, node: dict) -> str:
"""
将 JSON-LD 节点写入 L0 存储。
Args:
node: 完整的 JSON-LD 节点字典
Returns:
节点的 @id
"""
node_id = node.get("@id", "unknown")
self._store[node_id] = node
logger.info("L0 存储: 已写入节点 %s (大小: %d bytes)",
node_id, len(json.dumps(node, ensure_ascii=False)))
return node_id
def get_node(self, node_id: str) -> Optional[dict]:
"""按 @id 读取节点"""
return self._store.get(node_id)
class L2IndexManager:
"""模拟 L2 内存索引(Oxigraph 摘要索引)"""
def __init__(self):
self._index: dict[str, str] = {}
async def index_summary(self, node_id: str, summary: str) -> None:
"""
在 L2 中建立摘要索引。
Args:
node_id: 节点的 @id
summary: 摘要文本
"""
self._index[node_id] = summary
logger.info("L2 索引: 已索引节点 %s (摘要长度: %d chars)",
node_id, len(summary))
def search_by_summary(self, keyword: str) -> list[str]:
"""按关键词搜索摘要(演示用)"""
return [
nid for nid, summary in self._index.items()
if keyword.lower() in summary.lower()
]
# ──────────────────────────────────────────────
# 5. Harness 引擎核心
# ──────────────────────────────────────────────
class HarnessEngine:
"""
Harness 引擎:LLM 简单 JSON → JSON-LD 节点的翻译层。
职责:
1. 校验 LLM 输出是否符合 Schema
2. 分配全局唯一 @id
3. 构建 JSON-LD 节点(含 @type、@context)
4. 生成向量嵌入
5. 写入 L0 持久存储
6. 在 L2 中建立摘要索引
"""
# JSON-LD 上下文定义(可扩展)
DEFAULT_CONTEXT = {
"@vocab": "https://agent-harness.os/memory#",
"mem": "https://agent-harness.os/memory#",
"exec": "https://agent-harness.os/execution#",
"xsd": "http://www.w3.org/2001/XMLSchema#",
}
def __init__(
self,
session_id: str,
validator: Optional[SchemaValidator] = None,
embedding_service: Optional[EmbeddingService] = None,
l0_manager: Optional[L0StorageManager] = None,
l2_manager: Optional[L2IndexManager] = None,
):
self.session_id = session_id
self.block_counter = 0
self.validator = validator or SchemaValidator()
self.embedding_service = embedding_service or EmbeddingService()
self.l0_manager = l0_manager or L0StorageManager()
self.l2_manager = l2_manager or L2IndexManager()
async def process_llm_output(self, llm_output: LLMOutput) -> JSONLDNode:
"""
处理 LLM 输出,返回完整的 JSON-LD 节点。
Args:
llm_output: LLM 输出的三字段字典
Returns:
转换后的 JSON-LD 节点
Raises:
ValueError: Schema 校验失败
RuntimeError: 存储写入失败
"""
# 步骤 1:Schema 校验
try:
self.validator.validate(llm_output, schema_name="llm_output_v1")
except ValueError as e:
logger.error("LLM 输出校验失败: %s", e)
raise
# 步骤 2:分配 @id
self.block_counter += 1
node_id = f"memory:{self.session_id}/block-{self.block_counter:03d}"
# 步骤 3:生成向量嵌入
try:
embedding = await self.embedding_service.index(llm_output["contents"])
except Exception as e:
logger.warning("嵌入生成失败,跳过: %s", e)
embedding = None
# 步骤 4:构建 JSON-LD 节点
now = datetime.now(timezone.utc).isoformat()
jsonld_node: JSONLDNode = {
"@id": node_id,
"@type": ["mem:MemoryBlock", "exec:TaskResult"],
"@context": self.DEFAULT_CONTEXT,
"mem:think": llm_output["think"],
"mem:contents": llm_output["contents"],
"mem:summary": llm_output["summary"],
"mem:createdAt": now,
}
if embedding is not None:
jsonld_node["mem:embedding"] = embedding
# 步骤 5:写入 L0 持久存储
try:
await self.l0_manager.insert_node(jsonld_node)
except Exception as e:
raise RuntimeError(f"L0 写入失败: {e}") from e
# 步骤 6:在 L2 中建立摘要索引
try:
await self.l2_manager.index_summary(node_id, llm_output["summary"])
except Exception as e:
logger.warning("L2 索引失败(不影响主流程): %s", e)
logger.info("Harness 处理完成: %s", node_id)
return jsonld_node
# ──────────────────────────────────────────────
# 6. 使用示例
# ──────────────────────────────────────────────
async def main():
"""演示 Harness 引擎的完整工作流程"""
# 初始化引擎
engine = HarnessEngine(
session_id=f"session-{uuid.uuid4().hex[:8]}",
validator=SchemaValidator(),
embedding_service=EmbeddingService(),
l0_manager=L0StorageManager(),
l2_manager=L2IndexManager(),
)
# 模拟 LLM 输出
llm_response: LLMOutput = {
"think": (
"用户请求设计数据库 Schema。"
"分析需求:需要用户表,包含 UUID 主键和唯一邮箱约束。"
"选择 PostgreSQL 作为目标数据库。"
),
"contents": (
"CREATE TABLE users (\n"
" id UUID PRIMARY KEY,\n"
" email VARCHAR(255) UNIQUE NOT NULL,\n"
" created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP\n"
");"
),
"summary": "为用户表设计了 PostgreSQL Schema,包含 UUID 主键和唯一邮箱约束",
}
print("=" * 60)
print("Harness 引擎实战演示")
print("=" * 60)
# 步骤 1:处理 LLM 输出
print("\n[1] 接收 LLM 输出:")
print(json.dumps(llm_response, ensure_ascii=False, indent=2))
try:
node = await engine.process_llm_output(llm_response)
except (ValueError, RuntimeError) as e:
print(f"\n[错误] 处理失败: {e}")
return
# 步骤 2:查看转换后的 JSON-LD 节点
print("\n[2] 转换后的 JSON-LD 节点:")
print(json.dumps(node, ensure_ascii=False, indent=2, default=str))
# 步骤 3:验证存储
print("\n[3] 验证存储:")
stored = engine.l0_manager.get_node(node["@id"])
if stored:
print(f" ✅ L0 存储: 节点 {node['@id']} 已持久化")
else:
print(f" ❌ L0 存储: 节点未找到")
# 步骤 4:验证 L2 索引
print("\n[4] L2 索引搜索 ('用户表'):")
results = engine.l2_manager.search_by_summary("用户表")
if results:
for rid in results:
print(f" ✅ 找到: {rid}")
else:
print(" ⚠️ 未找到匹配(关键词不精确)")
# 步骤 5:错误处理演示
print("\n[5] 错误处理演示 — 传入空字段:")
try:
bad_input: LLMOutput = {"think": "", "contents": "some SQL", "summary": "test"}
await engine.process_llm_output(bad_input)
except ValueError as e:
print(f" ✅ 正确捕获错误: {e}")
print("\n" + "=" * 60)
print("演示完成")
print("=" * 60)
# ──────────────────────────────────────────────
# 7. 入口
# ──────────────────────────────────────────────
if __name__ == "__main__":
import asyncio
asyncio.run(main())
代码要点说明:
| 模块 | 职责 | 关键设计 |
|---|---|---|
SchemaValidator |
校验 LLM 输出完整性 | 检查必填字段、类型、非空,可扩展为 jsonschema/SHACL |
EmbeddingService |
生成向量嵌入 | 演示用 SHA-256 模拟,生产环境替换为真实模型 |
L0StorageManager |
全保真持久存储 | 模拟 redb KV,支持按 @id 读写 |
L2IndexManager |
摘要快速索引 | 模拟 Oxigraph 内存索引,支持关键词搜索 |
HarnessEngine |
核心翻译层 | 串联校验→ID分配→嵌入→构建→存储→索引全流程 |
运行方式:
# 安装依赖(生产环境需额外安装 jsonschema、openai 等)
pip install aiohttp
# 运行示例
python harness_client.py
预期输出片段:
[1] 接收 LLM 输出:
{
"think": "用户请求设计数据库 Schema...",
"contents": "CREATE TABLE users (...);",
"summary": "为用户表设计了 PostgreSQL Schema..."
}
[2] 转换后的 JSON-LD 节点:
{
"@id": "memory:session-a1b2c3d4/block-001",
"@type": ["mem:MemoryBlock", "exec:TaskResult"],
"mem:think": "用户请求设计数据库 Schema...",
"mem:contents": "CREATE TABLE users (...);",
"mem:summary": "为用户表设计了 PostgreSQL Schema...",
"mem:createdAt": "2026-06-30T07:09:07+00:00"
}
[5] 错误处理演示 — 传入空字段:
✅ 正确捕获错误: Schema 校验失败,字段 'think' 为空
此示例完整展示了 Harness 引擎的核心翻译流程,可直接作为集成参考或扩展起点。
3. 通用知识图谱:认知骨干
3.1 集成架构
Gliding Horse Agent OS 实现了统一知识图谱,通过 JSON-LD 和 Oxigraph 无缝集成五个核心子系统:
关键创新:不为技能、记忆、任务和代码知识维护独立的数据库,所有数据通过命名图隔离,存在于同一个 Oxigraph 存储中。这使得:
- 跨子系统查询:SPARQL 可以联合查询技能定义、任务历史和代码产物
- 统一索引:向量嵌入(HyperspaceEngine)通过
mem:embedding链接到 RDF 节点 - 一致的标识:
@id确保同一实体在所有上下文中被一致识别
3.2 实际示例:端到端工作流
让我们追踪这些组件在真实场景中如何协同工作:
场景:用户请求"将认证模块重构为使用 JWT"
步骤 1:任务初始化(5W2H 提取)
{
"@id": "task:auth-refactor-001",
"@type": "task:RefactoringTask",
"task:5W2H": {
"what": "用 JWT 替换基于 Session 的认证",
"why": "提升可扩展性,支持无状态微服务",
"who": { "requiredRole": "agent:Do" },
"when": { "deadline": "2026-06-01T18:00:00Z" },
"where": { "targetRepository": "github.com/myorg/auth-svc" },
"how": {},
"howMuch": { "tokenBudget": 10000 }
}
}
→ 存入 L2 黑板(Oxigraph 命名图:blackboard:task-001)
步骤 2:技能发现(SPARQL 查询)
PREFIX skill: <https://agent-harness.os/skill#>
SELECT ?skill WHERE {
GRAPH system:skills {
?skill a skill:AtomicSkill ;
skill:tags ?tag .
FILTER(CONTAINS(LCASE(?tag), "jwt"))
FILTER(?skill/maturity IN ("production", "stable"))
}
}
→ 返回:skill:rust-jwt-auth, skill:jwt-validation-middleware
步骤 3:代码知识提取(AST 解析)
# Tree-sitter 提取现有认证代码结构
tree-sitter parse src/auth.rs --json > ast_output.json
→ 转换为 RDF 三元组:
code:AuthModule a code:RustModule ;
code:hasFunction code:session_validate ;
code:locatedAt "src/auth.rs:42-156" .
→ 存入 L0 持久图谱(system:knowledge)
步骤 4:规划(PA 生成微流程 DAG)
PA 读取 5W2H 约束 + 技能定义 + 代码结构 → 生成执行计划:
{
"@id": "plan:auth-refactor-001",
"plan:steps": [
{ "order": 1, "action": "添加 jsonwebtoken 依赖", "skill": "skill:cargo-add" },
{ "order": 2, "action": "定义 Claims 结构体", "skill": "skill:rust-struct-design" },
{ "order": 3, "action": "实现 Token 签发", "skill": "skill:rust-jwt-auth" },
{ "order": 4, "action": "替换 Session 中间件", "skill": "skill:jwt-validation-middleware" }
]
}
步骤 5:执行(DA 调用工具)
// DA 通过 Harness 引擎调用工具
let result = harness.execute_tool(
"skill:rust-jwt-auth",
json!({ "secretKey": env::var("JWT_SECRET") })
).await?;
// Harness 按 SHACL 模式校验输入
// 用 Ed25519 签名调用
// 将结果写入 L2,@id: "blackboard:task-001/step-3-result"
步骤 6:检查(CA 按 5W2H 维度审计)
{
"auditBy5W2H": {
"what": { "verdict": "PASS", "evidence": "JWT 实现完成" },
"why": { "verdict": "PASS", "evidence": "无状态认证已实现" },
"when": { "verdict": "PASS", "evidence": "截止日期前完成" },
"howMuch": { "verdict": "WARNING", "evidence": "Token 预算已使用 85%" }
}
}
步骤 7:归档与学习(AA 更新技能图谱)
# 更新技能统计
INSERT {
skill:rust-jwt-auth skill:graphMeta ?newMeta .
?newMeta skill:usageCount 48 ;
skill:successRate 0.92 .
}
WHERE {
skill:rust-jwt-auth skill:graphMeta ?oldMeta .
# 计算新成功率...
}
结果:整个工作流利用了:
- ✅ 5W2H 进行结构化任务定义和审计
- ✅ JSON-LD 进行可互操作的数据交换
- ✅ 技能图谱 提供可复用的能力
- ✅ 知识图谱 进行代码理解
- ✅ L0-L3 记忆 实现高效的上下文管理
- ✅ Oxigraph 作为统一存储后端
3.3 性能特征
| 操作 | 延迟 | 机制 |
|---|---|---|
| L2 节点插入 | ~2ms | Oxigraph 内存 INSERT |
| L3 SPARQL 查询 | ~15ms | CONSTRUCT + Frame 投影 |
| L0 向量搜索 | ~1ms | HyperspaceEngine HNSW 索引 |
| 技能发现 | ~20ms | SPARQL + 向量相似度 |
| 代码 AST 解析 | ~100ms | Tree-sitter 增量解析 |
| Harness 验证 | ~5ms | JSON Schema + SHACL 检查 |
可扩展性:
- L2 支持约 500 ops/sec(适用于活跃任务工作集)
- L0 可扩展到数百万节点(磁盘存储 + 压缩)
- 命名图提供逻辑隔离而无需性能代价
4. 技能图谱与知识图谱融合:自进化认知架构
这是 Gliding Horse 区别于所有同类系统的一项根本性架构创新。传统设计中,技能(Skills)是静态指令文件,知识(Knowledge)是外部检索的文本块,两者彼此割裂。Gliding Horse 基于 JSON‑LD 语义总线,将技能、知识碎片、经验教训统一表达为图节点,使 Skill Graph 与 Knowledge Graph 天然融为一体。
4.1 三层自进化能力
经验自动回写: 每个任务完成后,AA(决策 Agent)自动从执行轨迹中提取失败模式、新关联和成功路径,以 KnowledgeFragment 形式挂载到对应技能节点上。下次执行同类任务时,这些碎片作为"免疫情报"自动注入上下文,避免重复踩坑。
技能图自生长: 当 DA(执行 Agent)遇到现有技能无法覆盖的问题时,系统触发 /learn 机制,SA 自动创建新技能草稿节点并建立与现有图谱的语义链接;/reduce 机制则从解决方案中提炼出标准化步骤,使技能从"草稿"演化为"已验证"状态。
信任与成熟度演化: 每个技能节点携带 successRate、usageCount、maturity 等运行时指标。随着成功执行的累积,技能自动从 experimental → stable → production 升级,信任体系逐层传递,无需人工干预。
4.2 与同类系统的对比
| 维度 | 其他 Agent 框架 | Gliding Horse |
|---|---|---|
| 技能组织 | 静态 Markdown 文件或代码函数,需人工维护 | JSON‑LD 图节点,6 种语义链接,可遍历、可推理 |
| 知识经验 | 独立于技能的向量库文本块,无结构化关联 | 经验碎片作为技能节点的附属图节点,自动挂载注入 |
| 技能演化 | 依赖开发者手动更新版本或重写 | AA 自动回写成功率、失败模式,成熟度自动升级 |
| 技能发现 | 按文件名或标签匹配 | SPARQL 语义查询 + 链接遍历,沿 Prerequisite/Related/Alternative 边发现最优技能链 |
| 上下文效率 | 全量技能描述注入 | 五级渐进式投影,按需从 MOC → 摘要 → 链接 → 步骤 → 全文逐层加载,Token 节省 >90% |
4.3 行业现状:两条技术路线各走各路
纯向量检索(RAG)方案(LangChain + Pinecone/Chroma)语义模糊匹配强,但无法表达"A是B的父类"这类结构化关系,实体间的精确关系淹没在向量空间里。纯知识图谱方案(Neo4j + SPARQL)精确关系查询强,但无法处理"跟这个意思差不多"的模糊匹配,需要精确 IRI 或关键词才能命中。
行业痛点是:大多数系统选择其中一条路,或者简单拼接(先向量搜、再图谱查,或反过来),两者之间缺乏统一的语义总线来调度和融合结果。
4.4 统一方案:JSON‑LD IRI 作为"统一地址总线"
Gliding Horse 从根本上解决了这个割裂问题:
三个关键创新:
-
IRI 作为统一标识符: HyperspaceEngine 中每个嵌入向量都对应一个 IRI(
hyperspace:embedding → urn:memory:session-042/block-017),向量检索返回的是一组 IRI,而非孤立的文本块。 -
IRI 作为桥梁: 拿到 IRI 后,L3 投影引擎立即在 Oxigraph 中执行 SPARQL 查询,获取该实体的所有关联属性、上下游关系、历史版本,实现向量语义与图结构的无缝衔接。
-
双向互检索: 用户也可先在图谱中精确定位某个实体,再通过该实体的嵌入向量在 HyperspaceEngine 中找到"语义相近"的其他实体,形成从精确到模糊的完整检索闭环。
5. JSON-LD 作为统一语义总线:上下文压缩与按需解引用
本系统以 JSON-LD 作为统一语义总线,将提示词、技能、记忆全部建模为可寻址、可校验、可追溯的图节点。其核心创新在于 "摘要 + IRI"的上下文压缩与按需解引用机制:
-
上下文经济:LLM 每次输出除
thought与content外,必须携带精炼的summary。Harness 仅将summary与关键实体的@id(IRI) 回写进上下文历史,而完整的content则存入 Oxigraph 持久图。此举使多轮对话的 Token 消耗与历史长度近乎无关,而 LLM 可随时通过内置工具沿 IRI 发起图查询,瞬间恢复任意历史细节。 -
技能即数据:所有 Skill 均以 JSON-LD 节点定义,携带
inputSchema、输出类型、数字签名与语义链接。系统提供自动转换工具,可将普通 Markdown 描述提升为符合规范的 JSON-LD Skill,实现零摩擦兼容。统一的@context机制使异构 Skill 的参数名差异在语义层消解,配合 JSON Schema 强校验与 Ed25519 签名,构成内核级安全防线。 -
记忆与执行同构:Agent 间的共享状态、任务元数据 (5W2H)、设计文档与历史经验全部作为图节点持久化于 Oxigraph。依靠 SPARQL 图查询和命名图隔离,记忆的加载、投影、一致性与淘汰完全类比于 CPU 的缓存体系 (L1-L3/L0),从而在任意规模下保持推理的流畅性与上下文完整性。
该设计将 Agent 从"一次性提示工程对象"重构为"运行在图数据库操作系统上的持久化进程",为长周期、多 Agent、高可靠性场景提供了坚实基座。
总结
这四个设计支柱——5W2H + PDCA 作为通用框架、通过 Harness 引擎简化 JSON-LD 使用、通用知识图谱集成、以及 JSON-LD 作为统一语义总线——构成了 Gliding Horse Agent OS 的认知骨干。它们实现了:
- 结构化意图建模:每个任务精确定义(5W2H)并系统执行(PDCA)
- 高效的 LLM 交互:简单 JSON 输入(think/contents/summary)转换为丰富的 JSON-LD 输出
- 统一数据管理:单一 Oxigraph 存储,支持跨子系统查询
- Token 经济的上下文管理:基于摘要的 L1/L2 结合全保真 L0 归档(按需缺页加载)
- 可扩展的技能生态:专业模型(SWOT、5 Whys 等)作为可插拔技能
- 可追溯性与调试:think/contents 完整保留于 L0 供事后分析
它们共同创造了一个既强大(处理复杂的多智能体工作流)又实用(在 LLM 限制和 Token 预算内工作)的系统。
关键设计原则
| 原则 | 实现 | 收益 |
|---|---|---|
| 双通用框架 | 5W2H(意图)+ PDCA(执行) | 处理从简单到复杂的任何任务 |
| 混合 JSON 处理 | LLM 生成简单 JSON → Harness 转换为 JSON-LD | 发挥 LLM 优势同时保持语义互操作 |
| CPU 缓存启发的记忆 | L0(磁盘)/ L1(上下文)/ L2(工作集)/ L3(投影) | 平衡性能、容量和 Token 经济性 |
| 缺页故障模式 | L2 中存摘要,L0 中存全内容,按需加载 | 保持活跃上下文小巧的同时保留全保真 |
| 统一知识图谱 | 所有子系统通过命名图共享单一 Oxigraph 存储 | 支持跨域查询和一致的标识 |
架构哲学
Gliding Horse Agent OS = 古老智慧 × 现代技术
木牛流马 → 自主运输驾驭
↓
Agent Harness → 多智能体编排基础设施
↓
核心创新:
• 5W2H + PDCA:所有可执行工作的通用框架
• JSON-LD + Harness:连接 LLM 简洁性与语义网标准
• 统一知识图谱:横跨技能、记忆、任务和代码的唯一真相源
此设计传承了诸葛亮构建自适应系统以延伸人类能力的遗产,如今应用于 AI 智能体编排领域。
本文是 CORE_DESIGN_PHILOSOPHY.md 的中文翻译。有关项目概述,请参阅 README.md 或 README.zh.md。
更多推荐



所有评论(0)