fashion-item-extractorlisted
Install: claude install-skill Jarad-z/fashion-item-extractor
# Fashion Item Extractor — 穿搭照逐件拆解并还原成单品白底图
你的任务:拿到一张有人穿搭的照片(秀场、街拍、明星图、lookbook 都行),**把里面每一件可识别的单品逐一拆出来**,并一路做到**每件的成品电商白底图**。
这件事的价值:用户看到一张好看的整体造型,想知道"这身到底由哪些东西组成"、想逐件复刻或找同款。你要做的是当一个**有经验的买手/造型师的眼睛**,把一张融合在一起的 look 拆解成清晰的单品,再真正还原成可用的单品白底图。
## 默认工作流:三步走到底
拿到穿搭图,**默认依次走完这三步**,不用等用户逐步开口:
1. **拆解 + 写单品图 prompt** —— 逐件识别、看准维度、为每件写一段白底单品 prompt。
2. **截出每件的实拍图** —— 用 `scripts/crop_items.py` 把原图里每件矩形裁剪出来,当视觉锚点。
3. **生成成品白底图** —— 用 `scripts/generate_whitebg.py` 把「截图 + prompt」喂图生图模型,真正出成品图。
**两个例外让步骤提前停下**:① 用户明说"只拆解 / 只要文字 prompt / 别出图"——停在他要的那步;② 出图所需的 API key/依赖没配——停在步骤二(截图),提示用户配好就能接着出(见步骤三)。
这是 `fashion-model-shot` 技能的逆操作。两者配合:整图 →(本技能)→ 单品白底图;单品图 →(fashion-model-shot)→ 模特上身图。
## 步骤一:拆解每件单品 + 写单品图 prompt
### 拆解原则:全部拆到底
一张造型图里能识别的单品都要拆,不要只拆主要服装。完整地过一遍这个清单,逐项检查图里有没有:
- **主体服装**:上衣 / T恤 / 衬衫 / 卫衣 / 针织衫 / 下装(裤/裙) / 连衣裙 / 连体衣
- **外层**:外套 / 大衣 / 西装 / 夹克 / 风衣 / 马甲
- **鞋**:款式、颜色、鞋型
- **包**:手提 / 单肩 / 斜挎 / 双肩 / 手拿,材质、颜色、五金
- **头部**:帽子 / 头巾 / 发饰 / 眼镜墨镜
- **颈部**:项链 / 围巾 / 丝巾 / choker
- **手腕手部**:手表 / 手镯 / 戒指 / 手套
- **耳部**:耳环 / 耳饰
- **腰部**:腰带 / 腰封
- **腿足**:袜子 / 丝袜 / 腿套
**判断尺度**:能在图里明确看清、且是穿戴的单品就拆出来。看不清的不硬编(比如背面的包看不到正脸、被头发挡住的耳饰),但要诚实标注"图中部分遮挡/不可见",不要凭空编一个。如果某件单品只露出一角无法判断细节,可以拆出来但说明"仅可见局部"。
按"从上到下、从主到次"的顺序拆,读起来清楚:头 → 上身 → 外层 → 下身 → 鞋 → 包 → 配饰。
### 每件单品要看准的维度
对每一件,像写商品详情页一样把这些维度看准——这是后面单品图 prompt 能还原的地基(看错则全错):
- **品类与版型**:具体到款(不是"上衣"而是"oversize 落肩圆领卫衣")。版型决定平铺/挂拍时的形态。每件做到「具体色修饰词 + 精确品类 + 一个关键结构/工艺细节」的密度,且**每件独立成段**——如"酒红色尖头乐福鞋,金属马衔扣""白色短袖T恤,锈红色插肩袖拼接",不要把多件并进一句。
- **合身度/垂坠状态**:这件穿