ref-analyzelisted

参考视频解析（P0）。下载某 UP 主的视频，做秒级拆解——语音转文字、镜头切换点、响度节奏——并输出结构化分析报告（钩子位置、节奏、信息密度、可复用的结构 SOP）。当用户说"分析这个视频/参考一下这个 up 主/拆解这条视频的结构"时使用。
wohuishuo/cc-video-pipeline · ★ 1 · Code & Development · score 62

Install: claude install-skill wohuishuo/cc-video-pipeline

# 参考视频解析 (ref-analyze) 把一条优秀视频拆成可学习的结构，沉淀成 SOP。面向 Vlog 与科普两类（需要结构/节奏借鉴的）。 ## 何时用用户给一个视频链接（B站/抖音/YouTube/TikTok），想学它的开场钩子、节奏、信息密度、分段结构。 ## 环境前提（已搭好） - ffmpeg / yt-dlp 在 PATH（scoop） - 转录双引擎：FunASR（中文高准确率+标点）+ faster-whisper（多语言/抗噪） - 统一入口：`tools/transcribe_dispatch.py`（自动路由），走 venv（**勿用系统 Python 3.14**） - 产物落在 `reference/<slug>/` ## 流程 ### 1. 下载 + 抽音频 ```powershell .\.claude\skills\ref-analyze\scripts\fetch.ps1 -Url "<链接>" -Slug "<up主-选题名>" ``` 产出：`reference/<slug>/` 下的 `video.mp4`、`audio.wav`、`*.info.json`、缩略图。 ### 2. 语音转文字（智能路由） ```powershell # 推荐：自动路由 — 中文走 FunASR（高准确率+标点），其他走 faster-whisper .\tools\.venv\Scripts\python.exe .\tools\transcribe_dispatch.py ".\reference\<slug>\audio.wav" --lang auto # 或手动指定引擎： .\tools\.venv\Scripts\python.exe .\tools\transcribe.py ".\reference\<slug>\audio.wav" --lang auto # faster-whisper .\tools\.venv\Scripts\python.exe .\tools\transcribe_funasr.py ".\reference\<slug>\audio.wav" --lang zh # FunASR ``` 产出：`audio.srt`（字幕，FunASR 已带标点）、`audio.json`（段级时间戳）。 - 中文推荐 FunASR：WER ~3.2%（whisper ~8.7%），标点 91.3%，支持热词定制。 - 多语言/噪音场景用 faster-whisper（99 语言 + 抗噪更强）。 - 首次运行 FunASR 会自动下载模型 ~1GB。 ### 3. 客观信号 + 抽帧 ```powershell .\.claude\skills\ref-analyze\scripts\probe.ps1 -Dir ".\reference\<slug>" .\.claude\skills\ref-analyze\scripts\extract_frames.ps1 -Video ".\reference\<slug>\video.mp4" -OutDir ".\reference\<slug>\frames" -Cuts ".\reference\<slug>\cuts.txt" -MaxFrames 120 ``` 产出：`cuts.txt`（镜头切换）、`rms.txt`（响度包络）、`frames/`（关键帧图片，供 Claude