ref-analyzelisted
Install: claude install-skill wohuishuo/cc-video-pipeline
# 参考视频解析 (ref-analyze)
把一条优秀视频拆成可学习的结构,沉淀成 SOP。面向 Vlog 与科普两类(需要结构/节奏借鉴的)。
## 何时用
用户给一个视频链接(B站/抖音/YouTube/TikTok),想学它的开场钩子、节奏、信息密度、分段结构。
## 环境前提(已搭好)
- ffmpeg / yt-dlp 在 PATH(scoop)
- 转录双引擎:FunASR(中文高准确率+标点)+ faster-whisper(多语言/抗噪)
- 统一入口:`tools/transcribe_dispatch.py`(自动路由),走 venv(**勿用系统 Python 3.14**)
- 产物落在 `reference/<slug>/`
## 流程
### 1. 下载 + 抽音频
```powershell
.\.claude\skills\ref-analyze\scripts\fetch.ps1 -Url "<链接>" -Slug "<up主-选题名>"
```
产出:`reference/<slug>/` 下的 `video.mp4`、`audio.wav`、`*.info.json`、缩略图。
### 2. 语音转文字(智能路由)
```powershell
# 推荐:自动路由 — 中文走 FunASR(高准确率+标点),其他走 faster-whisper
.\tools\.venv\Scripts\python.exe .\tools\transcribe_dispatch.py ".\reference\<slug>\audio.wav" --lang auto
# 或手动指定引擎:
.\tools\.venv\Scripts\python.exe .\tools\transcribe.py ".\reference\<slug>\audio.wav" --lang auto # faster-whisper
.\tools\.venv\Scripts\python.exe .\tools\transcribe_funasr.py ".\reference\<slug>\audio.wav" --lang zh # FunASR
```
产出:`audio.srt`(字幕,FunASR 已带标点)、`audio.json`(段级时间戳)。
- 中文推荐 FunASR:WER ~3.2%(whisper ~8.7%),标点 91.3%,支持热词定制。
- 多语言/噪音场景用 faster-whisper(99 语言 + 抗噪更强)。
- 首次运行 FunASR 会自动下载模型 ~1GB。
### 3. 客观信号 + 抽帧
```powershell
.\.claude\skills\ref-analyze\scripts\probe.ps1 -Dir ".\reference\<slug>"
.\.claude\skills\ref-analyze\scripts\extract_frames.ps1 -Video ".\reference\<slug>\video.mp4" -OutDir ".\reference\<slug>\frames" -Cuts ".\reference\<slug>\cuts.txt" -MaxFrames 120
```
产出:`cuts.txt`(镜头切换)、`rms.txt`(响度包络)、`frames/`(关键帧图片,供 Claude