OpenSpace:让AI Agent自己学会「吃一堑长一智」

10次阅读

你花了两周调好的 Agent,上线第三天,换了个会话——它又犯同样的错。

这不是偶发故障。这是结构性问题: 当前所有主流 Agent 框架都没有记忆机制 。每次会话从零开始,每次重置代价全由用户承担。Prompt 调优的成果,保不住;多 Agent 协作的经验,传不了。

OpenSpace 解决这个问题: 让 Agent 从经验中学习,并把学到的东西分享给其他 Agent

OpenSpace 是 HKUDS(香港大学数据科学实验室)开源的 AI Agent 自进化框架,GitHub 6371 ⭐,定位是 Agent 的「记忆与共享层」。

核心思路:

每次执行成功,Agent 学到一点;每次失败,也学到一点。所有经验沉淀为可复用的 Skills,共享给所有 Agent。

它不是独立工具,而是一个技能层,可接入 OpenClaw、nanobot、Claude Code、Codex、Cursor 等主流 Agent。

当一个 Skill 失效时,OpenSpace 自动分析失败原因并触发修复流程。成功路径自动沉淀为更高版本的 Skill。

这意味着:

  • Auto-Fix:Skill 坏了,自己修
  • Auto-Improve:有效模式持续优化
  • Auto-Learn:从真实使用中捕获有效工作流

质量监控贯穿全程:每个 Skill 的执行成功率、错误率被持续追踪,低于阈值自动触发修复。

一个 Agent 学到的经验,可分享给所有 Agent。

Agent A 学到一个高效的 PDF 解析 Skill
       ↓ 上传(私有 / 团队 / 公开)Agent B 下载,立刻拥有同样能力
       ↓
Agent C 也下载了 ……

参与者越多,生态越强——这是 OpenSpace 最核心的价值。

官方 benchmark(GDPVal 经济评估,50 个专业任务):

指标 数据
性能提升 4.2×
Token 节省 46%
合规类任务提升 +18.5%
工程类任务提升 +8.7%

同样的任务,OpenSpace Agent 做得多、花得少。

场景一:PDF 解析 Agent
某咨询团队有一个 Agent 负责解析客户提交的 PDF 报告。早期版本对扫描件识别率只有 60%,每次发现漏识别字段,都要手动加 Prompt 补丁。三个月后,Prompt 已经臃肿到无法维护。
接入 OpenSpace 后,每次失败的解析案例自动沉淀为改进 Skill,经过三次自进化,扫描件识别率提升至 92%。新的会话直接继承这个 Skill,无需重复调优。

场景二:多 Agent 协作流水线
一个自动化测试流水线包含三个 Agent:测试生成 → 测试执行 → 结果分析。初期,三个 Agent 各自独立工作,同一类边界条件,测试生成 Agent 漏覆盖,执行 Agent 反复因同样原因失败,分析 Agent 因格式不一致反复报错。
接入 OpenSpace 后,测试执行 Agent 发现边界条件遗漏,自动将失败案例上传;测试生成 Agent 下载该经验后,将该边界条件加入检查清单。一周内,流水线整体成功率从 67% 提升至 89%。

OpenSpace 的执行循环:

 执行任务 → 监控质量 → 检测问题
              ↓
         触发自进化 → 生成候选 Skill
              ↓
         质量评估 → 通过则升级
              ↓
         加入 Skill Store → 其他 Agent 可用 

Skill Store 两种使用方式:

  1. 本地模式 :Skills 存本地目录,自己用
  2. 云端模式 :上传至 open-space.cloud,授权后分享

安装(Python 3.12+):

git clone https://github.com/HKUDS/OpenSpace.git
cd OpenSpace
pip install -e .
openspace-mcp --help   # 验证安装 

接入 Agent(以 OpenClaw 为例),在 MCP 配置中加入:

{
  "mcpServers": {
    "openspace": {
      "command": "openspace-mcp",
      "toolTimeout": 600,
      "env": {
        "OPENSPACE_HOST_SKILL_DIRS": "/path/to/your/agent/skills",
        "OPENSPACE_WORKSPACE": "/path/to/OpenSpace",
        "OPENSPACE_API_KEY": "sk-xxx(可选,用于云端)"
      }
    }
  }
}
  • Beta 阶段 :v0.1.0 才发布,生产环境使用需评估

  • Skill 质量依赖 :自动修复 / 进化效果取决于底层 LLM 的判断能力

  • 生态建设初期 :Skill Store 丰富度还不够,需要社区贡献

  • AI Agent 开发者 :想让自己的 Agent 具备持续学习能力

  • 多 Agent 团队 :Agent 之间共享经验,减少重复试错

  • 企业级 Agent 应用 :关注稳定性、可靠性和长期维护成本

如果你的工作流依赖多个 Agent,经验无法积累是直接的时间浪费。每个 Agent 反复犯同样的错,每个新会话重新调优,这是工程上不可接受的状态。

OpenSpace 先开源、先跑通了这个方向。它的 benchmark 数据(4.2× 性能提升、46% Token 节省)说明这条路可行。在多 Agent 协作越来越常见的趋势下,共享与进化能力会成为 Agent 系统的核心竞争力——而 OpenSpace 是目前这个方向上最成熟的开源方案。

相关链接:

如果你在运营多个 AI Agent,OpenSpace 是目前最值得关注的记忆层方案。

正文完