#YC总裁GStack深度解析:一人成军的AI工程革命,从"提示词集合"到"虚拟工程团队"的方法论跃迁
2026年3月,Y Combinator CEO Garry Tan在GitHub上开源了一个项目,取名GStack。没有任何发布会,没有任何PR轰炸,三个月内狂揽90万星,成为当年增长最快的开源项目之一。
这不是一个"提示词合集"。这不是一个"AI助手包装器"。这是一个用20年产品开发经验编码的工程纪律框架——它把Claude Code从一个随时可能失控的单兵,强行捏合成一支由CEO、设计师、架构师、QA、安全官和发布工程师组成的虚拟工程团队。
60天内,3个生产级服务,40多个功能,日均1-2万行代码——这一切发生在YC全职CEO的业余时间。
与此同时,Andrej Karpathy在播客里说:"我大概从12月就没亲手敲过一行代码了。"硅谷的顶级工程师们正在集体"戒代码"。
但批评声同样响亮:"这不就是一堆Markdown提示词吗?""60万行代码,AI生成的有多少是真正有意义的?""YC总裁靠AI写代码,跟我靠ChatGPT写周报有什么区别?"
本文将深入GStack的源码、骨架和工程逻辑,从技术本质出发,回答那个核心问题:GStack到底是怎么工作的?它凭什么值90万颗星?
一、为什么通用AI助手写代码"差点意思"
在深入GStack之前,我们需要先理解一个问题:通用AI编程助手,为什么写代码总是"差点意思"?
1.1 同一个AI同时扮演所有角色的代价
你用过通用AI助手写代码吗?典型的流程是这样的:
用户:"帮我看看这个模块有什么问题"
AI思考:我应该审查代码还是直接修复?
AI决策:用户说要"看看",那我就审查
审查结果:发现了3个问题,要我修复吗?
用户:"修吧"
AI思考:开始修复...等等,这个修复会不会破坏别的功能?
修复完成,但...
结果:修复了3个问题,引入了2个新bug
问题出在哪里?同一个AI在"审查模式"和"修复模式"之间跳来跳去,导致它无法建立对问题的完整认知。
资深工程师的脑子里会同时运行两套思维:
- "这段代码现在有什么问题?"
- "我修复这个问题时,会对系统其他地方产生什么影响?"
通用AI做不到这种"并发思考"——它每次只能专注于一个任务。当审查代码时,它不记得自己的修复历史;当修复代码时,它又不考虑审查结论。
1.2 专业 vs 通才的效率鸿沟
让我们看一个具体场景:修复一个支付模块的并发问题。
通用AI的做法:
- 理解问题描述
- 直接给出修复方案
- 验证...但无法完整验证(并发bug难以复现)
- 可能引入新的竞态条件
GStack虚拟团队的做法:
/investigate先做根本原因分析——追踪数据流,测试假设,找到真正的根因/plan-eng-review架构评审——这个修复对整个支付流程有什么影响?有没有遗漏的边界条件?/cso安全审查——这个并发修复有没有引入新的安全问题?(比如TOCTOU竞态)/review工程师审查——代码质量和最佳实践/qaQA测试——真实浏览器环境下的回归测试/ship发布——确保测试通过,覆盖率不降
两者的差异不是效率的差异,而是工程纪律的差异。
1.3 上下文腐化:AI助手的阿喀琉斯之踵
通用AI编程助手的另一个致命问题是上下文腐化(Context Corruption)。
当你在一个长会话里让AI做了50件事之后,AI的上下文窗口已经装满了:
- 早期对话中做出的设计决策,被遗忘在上下文的深处
- 中期引入的第三方库,AI不知道为什么选了它
- 后期修复的bug,早期的审查结论已经被覆盖
GStack的设计哲学正是为了解决这个问题:每个Skill都有明确的输入和输出,上下文不会随意扩散;每个Skill的结果都会持久化为结构化文档,供下游Skill读取。
二、GStack技术架构:从"工具集合"到"工程工厂"
2.1 核心定位:不是工具集合,是流程脚手架
GStack在GitHub首页的README里,第一句话就点明了定位:
gstack turns Claude Code into a virtual engineering team — a CEO who rethinks the product, an eng manager who locks architecture, a designer who catches AI slop, a reviewer who finds production bugs, a QA lead who opens a real browser, a security officer who runs OWASP + STRIDE audits, and a release engineer who ships the PR.
这不是一句营销话术。从技术实现角度看,GStack的每一行代码都在践行这个理念。
关键区分:
- 不是代码模板集合:不提供可复制的代码片段
- 不是提示词库:不是一堆"你是一个优秀的工程师,请写出优雅的代码"这样的提示
- 是流程脚手架:将20年产品开发经验编码为可复用的AI工作流
2.2 23个斜杠命令:按角色分类的技能体系
GStack的核心是23个斜杠命令(Slash Commands),每个命令对应一个虚拟工程角色。按功能可分为六大类:
规划层(Think Stage)
| 命令 | 角色 | 职责 |
|---|---|---|
/office-hours | YC Office Hours | 起点。6个强制问题重新定义产品。Push back用户的框架,生成设计文档供所有下游命令使用 |
/plan-ceo-review | CEO/Founder | 重新思考问题本身。10星产品藏在请求里的哪个角落?四种模式:Expansion、Selective Expansion、Hold Scope、Reduction |
/autoplan | Review Pipeline | 一键生成完整审查计划。自动运行CEO→设计→工程审查,只将品味决策提交给用户审批 |
设计层(Design Stage)
| 命令 | 角色 | 职责 |
|---|---|---|
/plan-design-review | Senior Designer | 每个设计维度打0-10分,并解释"满分10分是什么样的"。包含AI Slop检测(识别AI生成的平庸UI) |
/design-consultation | Design Partner | 从零构建完整设计系统。研究竞品格局,提出创意风险,生成逼真的产品原型 |
/design-shotgun | Design Explorer | 生成4-6个AI原型变体,在浏览器中打开对比板,收集反馈并迭代。"品味记忆"学习用户偏好 |
/design-html | Design Engineer | 将原型转换为生产级HTML/CSS。计算布局、文本自适应、动态高度,30KB、零依赖。能检测React/Svelte/Vue |
工程层(Build Stage)
| 命令 | 角色 | 职责 |
|---|---|---|
/plan-eng-review | Eng Manager | 锁定架构、数据流、ASCII图表、边界条件和测试用例。强制暴露隐藏假设 |
/plan-devex-review | Developer Experience Lead | 开发者体验审查:探索开发者画像、对标竞品上手时间、设计魔法时刻、逐步追踪摩擦点。20-45个强制问题 |
/review | Staff Engineer | 找到"通过CI但会在生产环境爆炸"的bug。自动修复明显问题,标记完整性缺口 |
/investigate | Debugger | 系统性根本原因调试。铁律:没有调查就没有修复。追踪数据流,测试假设,3次失败修复后停止 |
/codex | Second Opinion | OpenAI Codex CLI的独立代码审查。三种模式:review(通过/失败门控)、adversarial challenge、open consultation |
质量层(Test Stage)
| 命令 | 角色 | 职责 |
|---|---|---|
/qa | QA Lead | 测试应用、找到bug、用原子提交修复、用原子提交重新验证。为每个修复自动生成回归测试 |
/qa-only | QA Reporter | 与/qa相同方法论,但仅报告bug,不修改代码 |
安全层(Security Stage)
| 命令 | 角色 | 职责 |
|---|---|---|
/cso | Chief Security Officer | OWASP Top 10 + STRIDE威胁模型。17个误报排除规则,8/10+置信度门控,每个发现包含具体利用场景 |
发布层(Ship Stage)
| 命令 | 角色 | 职责 |
|---|---|---|
/ship | Release Engineer | 同步main、运行测试、审查覆盖率、推送、打开PR。如果没有测试框架则自动引导 |
/land-and-deploy | Release Engineer | 合并PR、等待CI和部署、验证生产健康。从"批准"到"生产验证"一步完成 |
/canary | SRE | 部署后监控循环。监控控制台错误、性能回归和页面失败 |
/benchmark | Performance Engineer | 基准测试页面加载时间、Core Web Vitals和资源大小。对比每个PR的前后性能 |
/document-release | Technical Writer | 更新所有项目文档以匹配刚发布的内容。自动捕获过时README |
反思层(Reflect Stage)
| 命令 | 角色 | 职责 |
|---|---|---|
/retro | Eng Manager | 团队感知的每周复盘。按人分解、发布streak、测试健康趋势、成长机会。/retro global跨所有项目运行 |
工具命令(Power Commands)
| 命令 | 角色 | 职责 |
|---|---|---|
/browse | QA Engineer | 赋予Agent真正的眼睛。真实Chromium浏览器,真实点击,真实截图,约100ms/命令 |
/pair-agent | Multi-Agent Coordinator | 与任何AI Agent共享浏览器。一次命令,一个paste,连接。支持OpenClaw、Hermes、Codex、Cursor |
/careful | Safety Guardrails | 危险命令警告(rm -rf、DROP TABLE、force-push) |
/freeze | Edit Lock | 将文件编辑限制在单一目录内,防止调试时意外修改其他范围 |
/guard | Full Safety | /careful + /freeze合一命令 |
/unfreeze | Unlock | 移除/freeze边界 |
/learn | Memory | 跨会话管理gstack学到的内容。审查、搜索、修剪、导出项目特定模式、陷阱和偏好 |
/gstack-upgrade | Self-Updater | 升级gstack到最新版本 |
2.3 核心方法论:Think → Plan → Build → Review → Test → Ship → Reflect
GStack最精妙的设计不是任何一个单独的命令,而是命令之间的衔接。
每个Skill的输出,都是下一个Skill的输入:
/office-hours
↓ 产出设计文档
/plan-ceo-review
↓ 产出战略评审
/plan-eng-review
↓ 产出测试计划
/qa
↓ 产出测试报告
/review
↓ 产出修复建议
/ship
↓ 产出PR
/document-release
↓ 产出更新文档
/retro
↓ 产出复盘报告
这种设计解决了AI编程助手最大的问题——上下文腐化。当上下文窗口快满的时候,下游命令不需要记得之前说了什么,只需要读取上一个命令的结构化输出。
2.4 技术实现:TypeScript + Bun的轻量化架构
GStack的技术栈极为简洁:
- TypeScript(71.2%) + Go Template(18.9%) + Shell脚本
- Bun v1.0+(运行时)或 Node.js(Windows)
- Playwright(浏览器自动化)
- 持久化Chromium守护进程(真实浏览器环境)
核心架构如下:
用户输入(自然语言)
↓
Claude Code Session
↓
gstack Skill层(SKILL.md)
├── 角色定义(CEO/工程师/设计师/QA)
├── 工作流程规范
└── 约束条件与检查清单
↓
CLI命令层
↓
执行层(Bun/Node + Playwright + Git)
↓
结构化输出(JSON/Markdown → 供下游读取)
这种架构的优势是零依赖部署。用户只需要安装Claude Code、Bun和Git,然后在终端里粘贴一行安装命令,Garry Tan20年的工程经验就全部就位了。
2.5 持久化上下文:WIP Checkpoint模式
GStack引入了WIP Checkpoint模式来解决长会话的上下文腐化问题:
gstack-config set checkpoint_mode continuous
开启后,Skill会自动在Git中创建WIP提交:
WIP: [gstack-context]
- Decision: 使用PostgreSQL而非MongoDB,因为需要强一致性
- Remaining: 用户认证模块、API网关
- Failed: 最初尝试用Supabase Auth,兼容性有问题
当会话崩溃或需要切换上下文时,/context-restore可以读取这些提交,重建会话状态。/ship命令会在PR前Filter-Squash这些WIP提交(保留非WIP提交),保持bisect的清洁性。
三、十大AI编程Agent通吃:GStack的平台无关性
GStack的另一个技术亮点是它的平台无关设计。虽然名字里带着"Claude Code",但GStack实际上支持10个主流AI编程Agent:
| Agent | Flag | 安装路径 |
|---|---|---|
| OpenAI Codex CLI | --host codex | ~/.codex/skills/gstack-*/ |
| OpenCode | --host opencode | ~/.config/opencode/skills/gstack-*/ |
| Cursor | --host cursor | ~/.cursor/skills/gstack-*/ |
| Factory Droid | --host factory | ~/.factory/skills/gstack-*/ |
| Slate | --host slate | ~/.slate/skills/gstack-*/ |
| Kiro | --host kiro | ~/.kiro/skills/gstack-*/ |
| Hermes | --host hermes | ~/.hermes/skills/gstack-*/ |
| GBrain (mod) | --host gbrain | ~/.gbrain/skills/gstack-*/ |
| OpenClaw | ACP协议 | 原生支持,技能开箱即用 |
| Claude Code | 默认 | ~/.claude/skills/gstack |
安装命令统一为:
git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/gstack
cd ~/gstack && ./setup
或者指定特定Agent:
cd ~/gstack && ./setup --host opencode
添加新Agent支持有多简单? GStack文档中明确说明:
"It's one TypeScript config file, zero code changes."
添加新Agent支持只需要一个TypeScript配置文件,不需要修改任何核心代码。这种设计哲学体现了GStack的核心理念:技能(Skills)应该是可移植的,不应该绑定在任何特定平台或Agent上。
四、OpenClaw集成:GStack的最强搭档
特别值得一提的是GStack对OpenClaw的深度集成。
OpenClaw通过ACP(Agent Communication Protocol)协议Spawn Claude Code会话,因此当Claude Code安装了GStack后,每个GStack Skill都能直接工作。用户只需在OpenClaw agent中安装GStack,然后就可以用自然语言驱动整个虚拟工程团队:
你说:"对这个仓库做安全审计"
→ Spawns Claude Code with Run /cso
你说:"帮我构建一个通知功能"
→ Spawns Claude Code with /autoplan → implement → /ship
你说:"帮我规划v2 API重新设计"
→ Spawns Claude Code with /office-hours → /autoplan,保存计划
不仅如此,GStack还为OpenClaw提供了4个直接对话式Skill,无需启动Claude Code会话即可在OpenClaw中运行:
| Skill | 功能 |
|---|---|
gstack-openclaw-office-hours | 6个强制产品问题 |
gstack-openclaw-ceo-review | 战略评审,4种范围模式 |
gstack-openclaw-investigate | 根本原因调试方法论 |
gstack-openclaw-retro | 每周工程复盘 |
安装方式:
clawhub install gstack-openclaw-office-hours gstack-openclaw-ceo-review gstack-openclaw-investigate gstack-openclaw-retro
这意味着即使你不使用Claude Code,也可以在OpenClaw中体验GStack的核心方法论。
五、团队模式:让整个工程团队都用GStack
GStack的--team模式解决了另一个现实问题:如何在团队中推广AI工程方法论?
传统方式下,每个人的Claude Code配置都是独立的,AI的工作方式各不相同,团队没有统一的工程纪律。
GStack的团队模式:
# 初始化团队模式
(cd ~/.claude/skills/gstack && ./setup --team) && \
~/.claude/skills/gstack/bin/gstack-team-init required && \
git add .claude/ CLAUDE.md && \
git commit -m "require gstack for AI-assisted work"
这样做的效果是:
- 团队成员加入项目时自动获得Gstack配置(通过
.claude/目录) - 工程纪律通过代码仓库传递(不依赖个人本地配置)
- 使用
required模式强制所有协作者使用GStack,或者用optional模式仅提示建议
这种设计将AI工程方法论从"个人工具"提升为"团队标准流程"——团队中的每个人都用相同的方式思考、计划、构建、审查、测试和发布。
六、性能真相:810倍的逻辑代码生产率
6.1 数据争议与真相
GStack发布后,最大的争议来自代码行数(LOC)统计。
批评者指出:AI生成的代码行数会被严重膨胀——AI倾向于写冗长的代码、添加大量注释、生成样板代码。60万行代码,"真正有意义的逻辑"可能只有几万行。
Garry Tan在GStack的官方文档里直接回应了这个争议(ON_THE_LOC_CONTROVERSY.md):
他的核心论点是:
"The LOC critics aren't wrong that raw line counts inflate with AI. They are wrong that normalized-for-inflation, I'm less productive. I'm more productive, by a lot."
具体数据:
| 指标 | 2013年(Bookface) | 2026年(GStack) | 倍数 |
|---|---|---|---|
| GitHub贡献次数 | 772次 | 1,237次 | 1.6× |
| 逻辑代码行/天 | 14行 | 11,417行 | 810× |
| 团队规模 | 多人团队 | 1人兼职(YC全职) | - |
| 产品周期 | 1.5年+400万美元 | 5天+200美元 | - |
"Year-to-date (through April 18), 2026 has already produced 240× the entire 2013 year."
6.2 什么是"逻辑代码行"(Logical LOC)?
Garry Tan定义的"逻辑代码行"是一种去通胀度量:
# 排除的内容:
# 1. 纯注释行(# 或 // 开头的行)
# 2. 空行
# 3. 重复样板(相同模式的多次重复,计一次)
# 4. AI生成但未实际使用的代码
def count_logical_loc(diff):
additions = diff.additions # 新增行
subtractions = diff.subtractions # 删除行
# 去膨胀调整
logical_additions = remove_comments(remove_whitespace(additions))
logical_subtractions = remove_comments(remove_whitespace(subtractions))
# 净逻辑变更
logical_loc = len(logical_additions) - len(logical_subtractions) * 0.5
return logical_loc
这个定义并不完美,但它的方向是对的:AI确实会膨胀代码量,但排除膨胀因素后,GStack的生产力提升仍然是数量级的。
6.3 最有说服力的对比:YC掌门人的亲身实验
2026年5月,YC在播客中发布了对Garry Tan的专访。访谈中,他复盘了一个惊人的实验:
一个13年没写过代码的投资人,5天、200美元,重建了曾经花掉400万美元和一年半时间的产品。
这不是在吹牛。这是在用真实的商业价值来衡量AI工程方法论的效果:
传统方式:
- 团队:多人大团队(包括前端、后端、DevOps、QA等)
- 时间:18个月
- 成本:400万美元(含人员工资、基础设施、风控等)
GStack方式:
- 团队:1人(Garry Tan本人)
- 时间:5天
- 成本:200美元(主要是API调用费用)
当然,这个对比有很多变量没有控制:
- 2013年的产品和2026年的产品,功能复杂度是否相同?
- 400万美元包含了哪些成本?是否包括失败迭代?
- 13年前的Garry Tan和现在的Garry Tan,产品能力是否有差异?
但无论如何,这个对比揭示了一个核心趋势:AI工程工具正在重新定义"一个人能交付多少价值"。
七、与同类方案横评:GStack vs Agent Skills vs OpenClaw
7.1 Addy Osmani的Agent Skills:Google工程总监的方法论
Addy Osmani(Google Chrome工程总监)发布的Agent Skills在定位上与GStack最接近:
| 维度 | Agent Skills | GStack |
|---|---|---|
| 创始人背景 | Google工程总监 | YC总裁 |
| 核心理念 | 流程优先于文字、反借口表 | 虚拟工程团队、角色分工 |
| 命令数量 | 20个核心斜杠命令 | 23个斜杠命令 + 8个工具命令 |
| 支持平台 | Claude Code为主 | 10个AI Agent通吃 |
| 覆盖阶段 | Define→Plan→Build→Verify→Review→Ship | Think→Plan→Build→Review→Test→Ship→Reflect |
| 方法论重点 | 规格驱动开发、渐进式实现 | 战略评审、设计质量、安全审查 |
两者最大的区别在于文化背景:
- Agent Skills代表Google的工程文化:严谨、可预测、强调测试和规格
- GStack代表YC的创业文化:快速验证、用户驱动、强调战略决策
7.2 Everything Claude Code:黑客马拉松冠军的工具箱
Everything Claude Code(ECC)是黑客马拉松冠军作品,定位是Claude Code的终极配置指南。它的覆盖面很广,但没有GStack那种系统化的工程方法论。ECC更像是一个"最佳实践集合",GStack则是一套"可执行的工程纪律"。
7.3 OpenClaw:GStack的最强搭档
OpenClaw作为底层Agent平台,与GStack是协作关系而非竞争关系:
OpenClaw(平台层)
↓ ACP协议Spawn会话
Claude Code + GStack(方法论层)
↓ 自然语言交互
虚拟工程团队(执行层)
OpenClaw负责会话管理、工具调用和外部集成;GStack负责工程纪律和角色分工。两者结合,实现了"OpenClaw的自然对话体验"+"GStack的工程方法论"的最佳组合。
八、争议与局限:GStack不是什么
8.1 它不是银弹
GStack在最乐观的使用场景下,是一个强大的工程加速器。但它不是银弹,有几个根本性的局限:
1. 领域知识仍需人类输入
GStack可以帮你组织已有的知识、审查代码质量、执行标准流程,但它不能替你学习一个全新的领域。如果你不了解金融交易系统的基本概念,GStack无法帮你从零构建一个TradingAgents——它只能在你有足够领域知识的情况下,帮你更高效地实现。
2. "AI Slop"风险
GStack内置了AI Slop检测(/plan-design-review中的评分机制),但它不能完全消除AI生成内容的平庸性。GStack可以强迫AI思考得更深,但它不能强迫AI产生真正的创意。真正的产品创意和战略判断,仍然来自人类。
3. 上下文窗口仍然是瓶颈
虽然GStack通过持久化和WIP Checkpoint模式缓解了上下文腐化,但在处理超大型代码库时,仍然会遇到窗口耗尽的问题。对于拥有数百万行代码的企业级项目,GStack的适用性会有所下降。
4. 安全审查不等于安全
/cso命令做了OWASP Top 10 + STRIDE威胁模型审查,但它的输出是建议性的,不是保证性的。真正的安全需要人类安全专家的判断、代码审计和渗透测试。
8.2 它到底是不是"一堆Markdown提示词"?
这是最常见的批评。让我直接回答:
从形式上看,是。 GStack的核心就是一堆.md文件,每个文件定义了一个角色的提示词。
从本质上看,不是。 区别在于:
- 结构化流程:每个提示词之间有明确的输入输出关系,形成流水线
- 持久化上下文:输出被写入文件,供下游读取,解决上下文腐化
- 工程约束内置:在提示词中硬编码了工程纪律(边界条件检查、安全审查、覆盖率要求等)
- 真实工具调用:通过Playwright执行真实浏览器测试,通过Git执行版本控制
如果一堆Markdown就能值90万星,那GitHub上随便一个"500个ChatGPT提示词"的仓库早就爆火了。GStack的价值在于那个把20年工程经验编码进去的过程,而不是提示词本身。
九、实践指南:从零开始搭建GStack开发环境
9.1 安装
第一步,确保你有所需的依赖:
- Claude Code(必需)
- Git(必需)
- Bun v1.0+(必需)
- Node.js(Windows必需,macOS/Linux可选)
第二步,安装GStack:
# 克隆仓库(单分支,减少下载量)
git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
# 进入目录并运行安装脚本
cd ~/.claude/skills/gstack && ./setup
安装脚本会自动:
- 检测已安装的AI Agent(Claude Code、Codex、Cursor等)
- 将GStack注册为斜杠命令
- 配置默认的CLAUDE.md
- 检查依赖项
第三步,添加到项目:
# 在项目根目录运行
cd ~/your-project && \
~/.claude/skills/gstack/bin/gstack-team-init optional && \
git add .claude/ CLAUDE.md && \
git commit -m "chore: add gstack AI engineering framework"
9.2 快速上手:5步体验GStack
第1步:产品构思
$ claude
You: /office-hours
Claude: 我会向你提出6个强制问题,帮助你重新定义产品。
请描述你要构建什么,以及它的核心价值...
第2步:战略评审
You: /plan-ceo-review
Claude: 我会重新审视这个产品方向。
让我先读取你刚才的office-hours记录...
[自动读取设计文档]
[开始10个维度的战略挑战]
[生成4种范围调整方案]
第3步:架构评审
You: /plan-eng-review
Claude: 我会锁定架构、数据流和边界条件。
[生成ASCII架构图]
[列出潜在故障模式和测试矩阵]
[生成测试计划供/qa使用]
第4步:审查与测试
You: /review
Claude: 开始代码审查...
[AUTO-FIXED] 2个问题
[ASK] 发现竞态条件,请批准修复
You: approved
Claude: 修复已提交。现在运行/qa...
第5步:发布
You: /ship
Claude: 开始发布流程...
✓ 同步main分支
✓ 运行测试:42 → 51(新增9个)
✓ 覆盖率:78.3%(未下降)
✓ PR已打开:github.com/you/project/pull/42
9.3 团队协作配置
在.claude/CLAUDE.md中配置团队级别的GStack使用策略:
# AI Engineering Standards
## Required Workflow
All AI-assisted coding work MUST use gstack skills.
## Skill Usage Protocol
- 产品构思: /office-hours
- 架构决策: /plan-eng-review
- 代码审查: /review
- QA测试: /qa(真实URL或staging环境)
- 发布: /ship
## Quality Gates
- 所有PR必须通过/review和/qa
- /cso安全审查适用于涉及认证、支付、数据处理的PR
- /benchmark必须在性能敏感的PR上运行
## Prohibited
- 不要在未运行/qa的情况下合并PR
- 不要跳过/review直接/ship
- 不要在没有/plan-eng-review的情况下做架构变更
十、总结与展望
GStack的出现,标志着AI编程工具进入了一个新阶段。
第一阶段:工具化。AI作为代码补全工具(GitHub Copilot)
第二阶段:助手化。AI作为编程助手,可以执行多步骤任务(Claude Code、Cursor)
第三阶段:工程团队化。AI被组织成虚拟工程团队,每个AI角色专注自己的职责(Agent Skills、GStack)
GStack的90万星,不是对"提示词工程"的奖励,而是对"工程纪律在AI时代仍然有效"这一命题的肯定。
YC的Garry Tan用GStack证明了:你不需要一个更大的AI,你需要的是一个更好的工程流程。 当你把AI放进一个结构化的工程框架里,它能交付的价值,会远超你的预期。
当然,GStack不是终点。它目前:
- 主要面向独立开发者和小型团队
- 对超大型代码库的支持还在探索中
- 创意发现和战略决策仍然需要人类主导
下一个问题已经摆在桌面上:如果一个人加AI等于一个工程团队,那一百个人加AI等于什么?
这个问题,YC孵化的下一批创业公司会给我们答案。
参考链接
- GStack GitHub: https://github.com/garrytan/gstack
- ON THE LOC CONTROVERSY: https://github.com/garrytan/gstack/blob/main/docs/ON_THE_LOC_CONTROVERSY.md
- OpenClaw GitHub: https://github.com/openclaw/openclaw
- Addy Osmani Agent Skills: https://github.com/addyosmani/agent-skill
- Y Combinator: https://www.ycombinator.com