← ClaudeAtlas

insight-extractorlisted

从长文本(直播文稿、会议记录、播客转录、文章)中提炼核心观点、金句、争议点和行动项。输出结构化的观点摘要,可直接供 article-forge 等下游 skill 使用。适用于:直播回放分析、会议纪要提炼、长文精读、内容策划前的素材整理。
jiabai/awesome-skills · ★ 1 · AI & Automation · score 62
Install: claude install-skill jiabai/awesome-skills
# Insight Extractor — 长文本观点提炼 ## 输入 接受任何长文本: - 直播/会议转写稿(video-to-text 输出的 `.txt`) - 播客文字版 - 长文章、研报 - 任意需要提炼的文本素材 ## 参考资料 处理直播、会议、播客这类长转写稿时,先读取 `references/extraction-guide.md`。它提供观点价值、金句筛选、争议点分析和话题分段的判断标准。 ## 提炼流程 ### Step 1: 通读全文,建立框架 快速扫描全文,识别: - **参与者**:有几位说话人?各自角色/立场是什么? - **话题边界**:讨论了哪几个大的话题?大约在什么时间段? - **情绪/态度变化**:哪些地方有争论、兴奋、犹豫? ### Step 2: 按话题分段提炼 对每个话题段落,提取: #### 核心论点 (Key Arguments) - 每位说话人的核心主张是什么? - 用一句话概括每个论点 - 标注论据类型:经验/数据/类比/假设 #### 金句 (Quotable Quotes) - 原话引用,保留口语感 - 优先选:有画面感的、反直觉的、能引发讨论的 - 标注说话人和大致时间戳 #### 争议点 (Debates & Tensions) - 哪些观点有分歧? - 双方各自的理由是什么? - 最终是否达成共识? #### 行动项 (Action Items) - 提到了哪些具体的下一步? - 谁负责?什么时间? ### Step 3: 输出结构化摘要 输出格式(Markdown): ```markdown # 观点摘要:<标题> ## 元信息 - 来源:<文件路径或名称> - 时长/字数:<> - 参与者:<说话人列表及角色> - 日期:<> ## 话题概览 1. <话题1名称> — 一句话总结 2. <话题2名称> — 一句话总结 ... ## 详细观点 ### 话题1:<名称> **核心论点:** - [说话人A] <论点> — <论据类型> - [说话人B] <论点> **金句:** > "原话引用" — 说话人, [MM:SS] **争议:** - <分歧描述> --- (重复每个话题) ## 行动项 - [ ] <具体事项> — 负责人, 时间 ## 整体洞察 - <3-5 条跨话题的高层洞察> - <这些讨论对行业/团队/读者意味着什么> ``` ### Step 4: 存档 保存到 `workspace/insights/` 目录: - 命名:`<来源简称>-insights.md`(如 `直播0226-insights.md`) ## 提炼原则 1. **保留原味**:金句用原话,不美化不总结。口语的力量在于真实。 2. **区分事实和观点**:某人说"我觉得 X 会取代 Y"是观点,不是事实。 3. **抓冲突和转折**:观点一致的地方一笔带过,有争论的地方展开。 4. **不补脑**:文本里没说的,不要推断。不确定的标注"待确认"。 5. **聚焦可行动**:优先提炼能变成文章、决策、行动的内容。 ## 长文本处理策略 - **< 30K 字**:一次性读取,直接提炼 - **30K - 100K 字**:分 3-5 段读取,逐段提炼后汇总 - **> 100K 字**:先用 grep/搜索定位关键段落,重点提炼 ## 与其他 Skill 的衔接 - 上游:`video-to-text`(提供转写稿) - 下游