← ClaudeAtlas

mineru-locallisted

把 PDF/DOC/PPT/Image 转成 Markdown。默认走本地 MinerU 3.1.4(M5 mbp 127.0.0.1:8010,1-3s/PDF),云端 fallback 走 mineru.net /api/v4(URL/extra_formats/local 离线)。一行命令 `pdf2md`,自动按输入路由。Trigger 词:pdf转md / pdf to markdown / 解析 pdf / mineru / pdf2md / 把这个 PDF 转成笔记 / 提取 PDF 内容 / arxiv 论文转 md。
LeoLin990405/grimoire-skill · ★ 6 · Data & Documents · score 74
Install: claude install-skill LeoLin990405/grimoire-skill
# MinerU 双通道:本地 + mineru.net 云端 > **配置(bundled into grimoire-skill)**:本地服务地址由环境变量 > `MINERU_LOCAL_URL` 指定,默认 `http://127.0.0.1:8010`。原作者用的是内网 > tailnet 主机,移植进本仓库时已脱敏为 localhost 默认值 + 可配置变量。 > 自己机器上:`export MINERU_LOCAL_URL=http://<你的-mineru-host>:8010`; > 无本地服务时自动回落 mineru.net 云端(需 `~/.config/mineru/token`)。 ## 服务架构 ``` 客户端 ├── 默认/auto + 文件输入 + local 在线 │ → curl POST ${MINERU_LOCAL_URL:-http://127.0.0.1:8010}/file_parse │ → M5 mbp mineru-api 3.1.4 (launchd KeepAlive) │ → pipeline / vlm-transformers 后端(Apple Silicon MPS) │ └── URL 输入 / --cloud / --format / auto+local 挂 → ~/.claude/skills/mineru/scripts/mineru-parse.sh → POST https://mineru.net/api/v4/extract/task (Bearer JWT) → 异步轮询 → ZIP 下载 → 解压拿 .md + images + JSON ``` **helper**:`~/bin/pdf2md`(已 chmod +x)— 自动路由 local / cloud **Token**:`~/.config/mineru/token`(exp 2026-05-28,到期前提示重新申请) ## 触发场景 用户提到下面任意一条 → 立即用本 skill: - "把这个 PDF 转成 Markdown" - "解析这个 PDF" - "PDF to Markdown" - "pdf2md" - "用 mineru 本地解析" - "提取 PDF 文字 / 表格 / 公式" - "OCR 这个扫描件" **不要走 cloud API**(旧 `mineru` skill 是 cloud 的,已不推荐 — token 收费、600 页限制、数据出机)。 ## 通道速览 | 通道 | 配额 | 单文件上限 | 速度(暖态)| 鉴权 | 状态 | |---|---|---|---|---|---| | **local M5** | 无 | 无 | 1-3s | 无 | ✅ | | **cloud `/api/v4`** | 1k 高优页/天 | **200 页** / 200MB | 10-30s | Bearer JWT | ✅ | | ~~web (Playwright)~~ | 5k 页/天 独立池 | 600 页 | 30-90s | session cookie | ⚠️ EXPERIMENTAL(runtime 调试中,见 mineru-web skill)| ## 决策表(自动路由) | 用户给的输入 / 需求 | 路由到 | 命令 | |--