← ClaudeAtlas

interview-transcription-twlisted

台灣採訪錄音轉錄與引語管理工作流程 (繁體中文/台灣專用版,對應 upstream interview-transcription 的美國版)。涵蓋:錄音檔管理、Whisper 中文模型 (large-v3、台/客/原民族語)、雅婷逐字稿、台灣商用轉錄服務、引語提取、時間軸對照、查證用 quote database、轉錄品質檢核、與 source-verification-tw / fact-check-workflow-tw 整合。錄音轉逐字稿、引語對照查核、訪談檔案管理、語音檔保存時觸發。記者、查核員、研究員、法務、紀錄片工作者必備。
richardvt/claude-skills-journalism-tw · ★ 0 · AI & Automation · score 60
Install: claude install-skill richardvt/claude-skills-journalism-tw
# 台灣採訪錄音轉錄工作流程 逐字稿**不是錄音的文字版,是查核的證據**。本 skill 提供從錄音→轉錄→引語→存檔的台灣場景工作流。 --- ## 何時使用 - 訪後將錄音轉為逐字稿 - 從逐字稿提取可發布引語 - 對照查核(原話 vs 報導引述) - 訪問檔案長期保存 - 多語言訪談(國/台/客/原民族語/英) - 法律案件之證據錄音轉錄 --- ## 一、錄音檔管理 ### 命名規範 ``` YYYY-MM-DD_受訪者_主題_序號.[副檔名] 範例:2026-05-28_林桂英_麵店拆遷_001.m4a ``` **避免**:用「錄音 001.m4a」「new recording.mp3」這種空泛名稱。 ### 多重備份(現場錄完即備) | 位置 | 用途 | |---|---| | 手機 / 錄音筆原檔 | 第一份 | | 雲端(Google Drive / Dropbox / iCloud) | 第二份 | | 本機 SSD | 第三份(編輯用) | | 編輯部 NAS / 共享磁碟 | 第四份(可選,涉公益重大案件) | ### 檔案格式 | 格式 | 何時用 | |---|---| | **WAV / FLAC** | 無損,法律案件、長期保存 | | **M4A (AAC)** | 一般採訪,平衡品質與大小 | | **MP3 192-320 kbps** | 廣電可用 | | **不要用 MP3 128 以下** | 品質太差影響轉錄準確度 | --- ## 二、轉錄工具(2026 年台灣可用) ### 開源 / 本地(免費 + 隱私安全) | 工具 | 語言 | 注意 | |---|---|---| | **OpenAI Whisper large-v3** | 中文、英文、台/客/原民族語(基本) | 本地跑;**對台灣口音國語有效**;客語、原民族語效果參差;需 GPU 較流暢 | | **WhisperX** | 同上 + 含時間軸對齊 + speaker diarization | 適合多人訪談 | | **Faster-Whisper** | 同上 + 速度更快 | CPU 也可跑 | | **Whisper.cpp** | 同上 + Mac M 系列優化 | M1/M2/M3/M4 用 GPU 加速 | ### 雲端商用(收費 + 速度快) | 工具 | 強項 | 注意 | |---|---|---| | **OpenAI Whisper API** | 大模型 + 雲端 | 隱私:檔案上傳到 OpenAI | | **Google Cloud Speech-to-Text** | 多語言 + 客製字典 | 隱私:檔案上傳到 Google | | **Azure Speech** | 商用穩定 + 多語言 | 隱私:檔案上傳到 Azure | | **Anthropic Claude API**(間接)| 上傳檔案 + 提示轉錄 | 不是主力轉錄工具 | ### 台灣本地服務 | 服務 | 強項 | 網址 | |---|---|---| | **雅婷逐字稿** | 台灣口音、台語(taimedialabs 旗下);**新聞工作者常用** | yating.tw | | **韻誌語音雲** | 客語、原民族語為強項 | 視專案 | | **聽錄文字稿(萬芳)** | 人工轉錄,品質高 | 人工服務 | ### 完美組合(2026 實務推薦) 1. **本地 Whis