pubmed-reference-resolverlisted
Install: claude install-skill hikataya01-netizen/pubmed-reference-resolver
# pubmed-reference-resolver
論文の参照文献リストを PubMed で逆引きし、**査読実務に直結する3ファイル**(統合監査レポート / PubMed CSV / abstract text)を生成するスキル。
## 使用目的
査読対象となる他者の論文に対し、References セクションから各文献を自動的に PubMed で検索・照合し、引用の正確性を機械的にチェックする。LLM 捏造引用 (ハルシネーション) の検証にも有効。
## 統合計画完了 (2026/04/23)
本スキルは 4 日間にわたる 7 ステップ統合計画 (Day1-Day4) を経て、以下の機能を実装済み:
- **Step 1**: Phase 1 split_references の境界バグ修正 (Dutch/French 小文字 lookahead 許容)
- **Step 2**: MDPI 形式 fast-path パーサ (LLM 費用ゼロで決定論的解決)
- **Step 3**: structure_all_references への fast-path 統合
- **Step 4**: manual_overrides.yaml サポート (特殊ケースの手動補正)
- **Step 5**: journal_audit モジュール (3 段階 severity 分類)
- **Step 6**: Stage 5 報告書への 4 層統合 (Dashboard/MAJOR/narrative/sidecar)
- **Step 7**: CI 基盤と再現可能環境 (requirements, GitHub Actions, README)
149 件 MDPI ゴールドスタンダードで byte 単位 fixture 一致を検証済み。
## 対応入力
- **ファイル形式**: PDF / DOCX / TXT (PDFが主用途)
- **引用スタイル**: Vancouver / AMA / APA / Harvard / Chicago / Nature / Cell / MDPI など不問
- **言語**: 英語論文のみ (和文文献は非対象)
- **件数**: 30件中心、100件超のレビュー論文にも対応 (149件で fixture 一致検証済)
- **PDF由来の行番号混入**: 行頭・行末・行中・数字連結・散在の5パターン全てに対応
## 出力3ファイル (4層統合設計)
| ファイル | 内容 |
|---------|------|
| `csv-{first_pmid}-set.csv` | PubMed純正互換CSV + `Ref_No`, `Duplicate_of` 列 (UTF-8 BOM) |
| `abstract-{first_pmid}-set.txt` | PubMed標準 abstract text 形式、番号付き、未ヒットは1行保持 |
| `report.md` | **統合監査レポート** (4 層構成): |
| | **層 1. Dashboard** — 解決/未解決/重複/重大・要検討・軽微の件数を一覧 |
| | **層 2. 要確認項目 (MAJOR/MODERATE/MINOR)** — 1.1 [MAJOR] にジャーナル名 vs DOI 不整合を含む |
| | **層 3. 構造化品質と未解決詳細** — `parsing_confiden