Gbrain:YC CEO 的自进化第二大脑

12次阅读

Garry Tan(Y Combinator CEO)有两套 AI Agent 装备。

GStack 解决的是 ” 怎么做 ”——23 个工具命令,把 AI 变成虚拟工程团队。

Gbrain 解决的是 ” 记住什么 ”——17,888 个页面、4,383 人、723 公司的知识图谱,让 AI 睡前摄入、醒来变强。

两个项目组合,才是 Garry Tan 的完整 AI Agent 闭环。

Gbrain 的核心理念很直接:

Your AI agent is smart but forgetful. GBrain gives it a brain.

Garry Tan 在 12 天内构建了自己的第二大脑,目前正在生产环境运行中——每天 21 个 Cron 任务自治运行,夜间自动去重、修复引用、评分、找矛盾、预备明日任务。

它的核心能力有两个:自治循环 混合搜索

Signal 检测 → 脑内搜索 → 响应 → 页面写入 → 自动链接 → 同步

每次交互都会触发完整闭环:

  • Signal 检测:捕获消息中的想法、实体提及、待办事项
  • 脑内优先查询:任何外部 API 调用前先查本地大脑(最快、最便宜、最个性化)
  • 自动链接 :页面写入时,纯模式匹配 [[wiki/people/bob]] 语法提取实体引用, 零 LLM 调用
  • Cron 驱动:夜间去重人员页面、修复引用、评分、找矛盾、预备明日任务

Garry Tan 的描述是:睡前 AI 摄入、醒来 AI 变强。

Gbrain 的搜索架构是四层混合:

  1. Vector 检索:HNSW/pgvector,稠密向量相似度
  2. BM25 关键词:稀疏检索,精确关键词匹配
  3. Reciprocal Rank Fusion:融合排序
  4. 知识图谱增强:实体关系推理

性能数据:

  • P@5:49.1%(图增强)vs 18.2%(图禁用)→ +31.4 分
  • R@5:97.9%

知识图谱是超越纯向量搜索的关键。纯向量 RAG 只能找到 ” 相似文本 ”,图增强搜索能回答 ” 谁在 Acme AI 工作 ” 这类需要关系推理的问题。

Gbrain 的图谱构建是 零 LLM 调用 的——纯模式匹配提取实体引用。

支持的边类型:attended、works_at、invested_in、founded、advises、mentions 等。

多跳遍历示例:

gbrain graph-query people/garry-tan --depth 2

v0.36.4.0 引入了自治修复能力:

gbrain doctor --remediate --yes --target-score 90 --max-usd 5

流程:

  1. 计算依赖排序计划(sync → extract → embed → consolidate)
  2. 每步提交 Minion 任务
  3. 每步后重新检查分数
  4. 拒绝超出成本上限
  5. Cron 可无人值守运行

Skills 路由在 skills/RESOLVER.md,覆盖:

类别 Skills 数量
Signal 捕获 signal detection
Ingest idea / media / meeting 摄入
Enrich 实体丰富化
Brain Ops 脑操作
Citation Fixer 引用修复
Daily Task Manager 每日任务管理
Cron Scheduler Cron 调度
Reports 报告生成
Voice 语音
Soul Audit 灵魂审计
Eval Framework 评估框架
Migrations 数据迁移

v0.36.2.0 新默认使用自研模型:

对比 速度 成本 胜率(20 queries)
ZeroEntropy 442ms $0.05/M 11/20
OpenAI 973ms $0.13/M

ZeroEntropy 的 Embedding 模型 zembed-1(1280d,Matryoshka)和 Reranker 模型 zerank-2,在速度和成本上都有显著优势。

60% 的 top-1 结果在使用 reranker 后被重新排序。

三种运行形态:

形态 适用场景
OpenClaw/Hermes Skillpack 已用 OpenClaw 或 Hermes 的用户(推荐 30 分钟安装)
独立 Shell 任何 MCP 感知客户端(Claude Code、Cursor、Windsurf)或纯 shell
HTTP MCP Server 团队共享,OAuth 2.1 + PKCE + DCR + 刷新令牌,/admin 仪表板

初始化极快:PGLite 模式 2 秒启动,无服务器、无 Docker。

维度 gbrain 通用 RAG
搜索方式 Vector + BM25 + Graph + RRF 纯向量检索
P@5 49.1% 18.2%
知识图谱 自链接,零 LLM 调用
自治修复 --remediate --target-score 90 手动
Cron 驱动 21 个任务夜间运行
实体关系 类型化边多跳遍历 平面检索
gbrain init --pglite
gbrain skillpack scaffold --all

bun install -g github:garrytan/gbrain
gbrain init --pglite
gbrain doctor  # 验证健康状态

gbrain serve        # stdio MCP
gbrain serve --http # HTTP MCP + OAuth 2.1 + Admin 仪表板

支持:Claude Desktop、Claude Code、Cursor、ChatGPT、Perplexity、Cowork。

  • 需要个人知识管理 + AI Agent 记忆系统的个人用户
  • 有大量人员 / 公司关系需要管理的投资人、创始人
  • 希望 AI Agent 具有长期记忆和上下文的企业团队
  • 对标 ChatGPT/Perplexity 的私有知识库场景

Gbrain 解决的是 AI Agent 的 ” 遗忘问题 ”——通用 AI 模型没有长期记忆,无法跨会话保持上下文。

Garry Tan 的方案是:知识图谱 + 混合搜索 + 自治修复,让 AI 在每次交互中主动构建和维护自己的记忆系统。

GStack(做)+ Gbrain(记)= YC CEO 的完整 AI Agent 闭环。

相关链接:

END

GStack 和 Gbrain 是我目前见过最完整的个人 AI Agent 工作流方案。后续会持续跟踪这类工具的进展。

正文完