cost-budgetlisted
Install: claude install-skill pcliangx/AppGenesisForge
# Cost & Token Budget Baseline
Agent Team 是吞 token 最快的协作形态——多个 teammate 各持独立上下文 × 长会话 × 多轮对话,单功能消耗很容易冲到几百万 token。本基线规定团队必须遵守的预算纪律与可验证的事后核账机制。
## 预算分级(默认值;项目可在 CLAUDE.md 覆盖)
| 任务规模 | 单次会话 token 上限(输入+输出合计) | 触发提示 | 触发硬停 |
|---|---|---|---|
| 小(单文件 / bugfix / 查询) | 100k | 80k | 150k |
| 中(功能开发 / 跨模块重构) | 500k | 400k | 800k |
| 大(完整 feature / 跨链路 PRD→UAT) | 2M | 1.6M | 3M |
> 这是**对话窗口**预算,不是 API 总账户预算。账户级预算由账单系统单独控制。
## 角色级纪律
- **product-lead**:每次拆任务前评估规模等级;规模超「中」必须在 PRD 顶部声明预估 token 与成本
- **tech-lead / 执行层**:发现自己即将超过单次「触发提示」阈值时主动 SendMessage product-lead 汇报进度并请示是否继续
- **任何 agent**:撞到「触发硬停」阈值时必须立即停下,不得擅自续跑
## Cache 利用率(必须 ≥ 60%)
- 高 cache miss 源于模板化文档过长 / agent 频繁切换;连续两次会话 cache hit < 50% 应触发优化
- 优化路径:把不常变的内容下沉到 skill / plugin skills、避免在 CLAUDE.md 反复改大段
- Sub-agent progress summaries 自 Claude Code 2.1.128 起走 prompt cache(`cache_creation` ~3× 减少),并在 idle subagent 上不再重复触发——Parallel Dispatch 多 teammate 场景的成本基线随之下移,看历史月度账单时若 sub-agent 占比突然下降无需调查
- 参考:[Anthropic Prompt Caching](https://docs.claude.com/en/docs/build-with-claude/prompt-caching)、[Reduce Token Usage](https://code.claude.com/docs/en/costs#reduce-token-usage)
## 模型降级路径(建议)
不是所有任务都需要 Opus。product-lead 判断任务足够明确、不涉及架构权衡时,鼓励 teammate 主动降级到 Sonnet 甚至 Haiku:
| 任务特征 | 推荐模型 |
|---|---|
| 架构决策 / 复杂权衡 / brainstorm | Opus |
| 标准 CRUD / 文档撰写 / 代码评审 | Sonnet |
| 文本提取 / 简单格式化 / 测试样板 | Haiku |
降级是工具,不是义务——若 Sonnet 多次产出不达预期,立即升回 Opus 别硬撑。
## Agent 默认 Model 路由(基线)
下表是 14 个 agent 的默认 model 选型与理由。任意调整需在 PRD 顶部备注复核效果:
| Agent |