pptx-document-processinglisted
Install: claude install-skill findscripter/everything-skills
## 何时使用
当用户要**创建、编辑或分析 `.pptx` 演示文稿**时使用。`.pptx` 本质是一个 ZIP 包,内含 XML 与媒体资源,可读可改。按四类任务分流:
- **读/分析内容**:抽取正文、讲者备注、批注、版式、动画、设计配色字体。
- **从零创建(无模板)**:走 html2pptx 工作流,把 HTML 幻灯片转成定位精确的 PPTX。
- **编辑现有文稿**:直接改 OOXML(拆包→改 XML→校验→打包)。
- **套模板创建**:复用现成模板的版式,复制重排幻灯片后替换占位文本。
不该用的边界:
- 只需纯文本、无版式/视觉要求 → 直接写 Markdown 或正文,别做 PPTX。
- 目标是 Word(`.docx`)或 Excel(`.xlsx`)→ 用对应文档技能,不用本技能。
- 仅需把 PPTX 内容做问答/总结 → 用「读/分析」分支抽文本即可,不必生成新文件。
- 一句话回复、随手笔记不构成演示场景。
## 步骤 / 指令
### A. 读取与分析
- 只读正文:转 Markdown
```bash
python -m markitdown path-to-file.pptx
```
- 需要备注/批注/版式/动画/复杂格式:必须拆包读原始 XML
```bash
python ooxml/scripts/unpack.py <office_file> <output_dir>
```
脚本若不在该路径,用 `find . -name "unpack.py"` 定位。关键结构:
- `ppt/presentation.xml` 主元数据与幻灯片引用
- `ppt/slides/slide{N}.xml` 单页内容
- `ppt/notesSlides/notesSlide{N}.xml` 讲者备注
- `ppt/comments/modernComment_*.xml` 批注
- `ppt/slideLayouts/`、`ppt/slideMasters/`、`ppt/theme/`、`ppt/media/`
- **仿照示例设计时**先提取配色与字体:读 `ppt/theme/theme1.xml` 的 `<a:clrScheme>`/`<a:fontScheme>`;看 `slide1.xml` 实际 `<a:rPr>` 用法;用 grep 搜 `<a:solidFill>`、`<a:srgbClr>` 跨文件找配色字体。
### B. 从零创建(html2pptx)
1. **强制先读整份** `html2pptx.md`(不要设行数范围),掌握语法与硬规则再动手。
2. 动手前**先声明设计取向**:分析主题/行业/受众,选 3–5 色调色板(主色+辅色+点缀,确保对比度),只用 web 安全字体(Arial、Helvetica、Times New Roman、Georgia、Courier New、Verdana、Tahoma、Trebuchet MS、Impact)。
3. 每页一个 HTML,按 16:9 设 `720pt × 405pt`;文本用 `<p>/<h1>-<h6>/<ul>/<ol>`;图表/表格区用 `class="placeholder"`(灰底占位)。**渐变与图标先用 Sharp 栅格化为 PNG** 再引用。
4. 含图表/表格的页用「整页布局」或「两栏布局(如 40%/60%)」,**严禁