OMC:双AI模型的对抗式代码审查,让bug无处可藏

13次阅读

代码审查是软件开发中最重要的质量关卡。但人肉 code review 有两个致命问题:疲劳 主观

同一个工程师,看第三遍代码的时候已经在走神;看同事代码的时候不好意思指出 ” 这里逻辑有问题 ”。

于是有了 AI code review。但单模型的 AI 审查也有局限——它会用同样的视角看代码,漏掉那些 ” 它没想到的问题 ”。

OMC(Oh My ClaudeCode) 的解法是:让两个 AI 模型互相攻击

Claude 负责构建,Codex 负责找茬。双方各有所长,互补之后,代码质量的上限被显著拉高。

OMC 的核心理念:

Two AI models enter. Better code leaves.

灵感来自 oh-my-zsh——它不是一个新的 AI 模型,而是一个 多模型编排框架,让不同模型做它最擅长的事。

生态里有 11+ 个相关仓库,核心项目包括:

  • omc-codex:Claude + Codex 双模型编排
  • omc-visual:浏览器可视化界面
  • dotclaude:多智能体编排 + plugins + hooks
任务 Claude 优势 Codex 优势
规划与架构 ✅ 深度推理
复杂实现 ✅ 多文件上下文(ralph loop)
快速修复 ✅ 沙箱快速
架构设计 ✅ deep reasoning
对抗性审查 ✅ 质疑姿态
结构化审查 ✅ 快速 JSON 输出
合成与决策 ✅ 优先级排序

Codex 的核心优势是 快速 质疑姿态——它不像 Claude 那样倾向于 ” 理解和认同 ”,而是更愿意说 ” 这里有问题 ”。这种对抗性正是代码审查需要的。

OMC 的核心工作流是 Blind TDD

Claude Opus 规划架构
    ↓
Codex 写测试(blind — 从没见过 Claude 的计划)↓
Claude 从测试构建(blind — 测试即 spec)↓
Codex 对抗性攻击
    ↓
Claude 修复所有 Codex 发现的漏洞
    ↓
Codex 最终结构化审查
    ↓
结果:经过双 AI 模型验证的战斗级代码

关键在于 blind——Codex 写测试的时候不知道 Claude 的计划,Claude 构建的时候不知道 Codex 的测试逻辑。双方独立工作,最终结果由双模型共同背书。

命令 功能
/omcx:forge 完整 pipeline:plan → blind TDD → build → stress harden → review → ship
/omcx:auto-ralph Claude 磨 + Codex 验证,循环直到两者一致
/omcx:auto-plan Claude 设计 + Codex 审查
/omcx:auto-validate 双 Codex 审查 + Claude 合成优先修复计划
/omcx:team N:model:role 并发多 Agent,指定数量和角色
/omcx:stress 对抗性强化:Codex 攻击,Claude 防御

OMC 的自动容错设计很实用:

情况 行为
Claude rate limit Codex 接管 build/plan/fix
Claude 配额耗尽 Codex 继续所有工作
Claude 上下文限制 Codex 处理剩余步骤
Codex 不可用 Claude agents 覆盖所有角色
Codex auth 失败 Claude code-reviewer + architect
双双不可用 停止并报告,需人工介入

一方出问题,另一方自动接管,工作不中断。

如果你在用 gstack(YC CEO 工作流)、superpowers(工程纪律)、opchain(跨会话记忆),OMC 是 开发交付层 的补充——它解决的是 ” 代码质量怎么拉到极限 ” 这个问题。

gstack(方向指挥)superpowers(工程纪律)opchain(Checkpoint 记忆)omc-codex(双模型对抗验证)← 新增
curl -fsSL https://raw.githubusercontent.com/jhcdev/omc-codex/main/install.sh | bash

/reload-plugins

npm install -g @openai/codex
codex login
  • 追求代码质量极限 的团队——不想只靠一个 AI 模型背书

  • 高风险项目——金融、医疗、安全相关,需要双重验证

  • 复杂系统——多文件上下文,单一模型容易遗漏

  • 想要 TDD 但不会写测试——blind TDD 让 AI 帮你写测试

  • 依赖双模型:需要 Claude Code + Codex CLI 两套环境

  • 资源消耗:双模型运行成本是单模型的两倍

  • 中文资料少:英文为主,上手需要一定基础

  • 生态新:刚起步,工具链不如 gstack 完善

OMC 解决的核心问题是:单模型审查有盲区

Claude 倾向于理解和构建,Codex 倾向于质疑和攻击。两个模型互相抵抗,最终留下的代码是经过双模型验证的战斗级代码。

Blind TDD 是这个框架里最有趣的部分——让两个 AI 独立工作,再用结果互相验证。这比 ” 一个 AI 写代码,另一个 AI 审查 ” 要聪明得多。

相关链接:

END

GStack + Gbrain + OMC,YC CEO 的工具箱正在变得越来越完整。

正文完