markitdownlisted
Install: claude install-skill matematicsolutions/awesome-matematic-skills-pl
# MarkItDown - konwerter dokumentów do Markdown (PL)
Lightweight utility Microsoftu - zachowuje strukturę (nagłówki, listy, tabele, linki), nie wygląd. Pod LLM, nie pod human.
## Instalacja (zrobione 2026-04-21)
```bash
python -m pip install --user markitdown markitdown-mcp
```
Wymaga Python 3.10+ (testowane na 3.14). CLI: `python -m markitdown`.
## Wspierane formaty
- **PDF** (preferuj dla krótkich, standardowych PDF; dla złożonych/tabel - OpenDataLoader PDF)
- **Office**: Word (.docx), Excel (.xlsx), PowerPoint (.pptx)
- **HTML, EPUB, CSV, JSON, XML**
- **Obrazy** (EXIF + OCR jeśli zainstalowane `[all]`)
- **Audio** (EXIF + transkrypcja jeśli włączone)
- **ZIP** (iteruje zawartość)
- **YouTube URL** (napisy)
## Użycie
### CLI (single file)
```bash
python -m markitdown input.pdf > output.md
python -m markitdown input.pptx -o output.md
```
### Batch (Obsidian Vault)
```bash
for f in "/c/Users/hp/Documents/Obsidian Vault/Konwerter"/*.pdf; do
python -m markitdown "$f" > "${f%.pdf}.md"
done
```
### Python API
```python
from markitdown import MarkItDown
md = MarkItDown()
result = md.convert("plik.docx")
print(result.text_content)
```
### MCP server
Opcjonalnie - jeśli chcesz udostępnić Claude Code jako MCP tool:
```bash
markitdown-mcp
```
## Kiedy użyć MarkItDown vs OpenDataLoader PDF
| Sytuacja | Narzędzie |
|---|---|
| Word/Excel/PPT | **MarkItDown** |
| Prosty PDF, tekst liniowy | **MarkItDown** (szybsze) |
| Złożony PDF z tabelami, reading order, papers naukowe