llm-evaluatelisted
Install: claude install-skill lucidlabs-hq/agent-kit
# LLM Model Evaluation
Evaluiert LLM-Modelle basierend auf aktuellem Preis/Leistungs-Verhältnis.
---
## Wann nutzen?
- Während `/init-project` bei der Komplexitätsbewertung
- Bei Kosten-Optimierung bestehender Projekte
- Wenn neue Modelle erscheinen (regelmäßig checken)
- Vor größeren Production-Deployments
---
## Step 1: Use Case verstehen
Falls kein Argument übergeben, frage:
```
Was ist dein Use Case?
Beispiele:
• "Chat-Bot für Kundenservice" (High-Volume, schnelle Antworten)
• "Dokumenten-Analyse" (Langer Context, Reasoning)
• "Code-Generierung" (Präzision wichtig)
• "GDPR-konforme EU-App" (Compliance)
• "Budget-Projekt" (Kosten minimieren)
```
---
## Step 2: Aktuelle Preise holen
**WICHTIG:** Preise ändern sich häufig. Hole aktuelle Daten.
### 2.1 Web Search für aktuelle Preise
Suche nach aktuellen Preisen mit WebSearch:
```
Query: "[Provider] API pricing 2026"
```
Für jeden Provider:
- Anthropic Claude pricing
- OpenAI GPT pricing
- Google Gemini pricing
- DeepSeek pricing
- xAI Grok pricing
- Mistral pricing
### 2.2 Pricing Endpoints (falls verfügbar)
Einige Provider haben öffentliche Pricing-Pages:
| Provider | Pricing URL |
|----------|-------------|
| Anthropic | https://www.anthropic.com/pricing |
| OpenAI | https://openai.com/api/pricing |
| Google | https://ai.google.dev/pricing |
| DeepSeek | https://platform.deepseek.com/api-docs/pricing |
| Mistral | https://mistral.ai/technology/#pricing |
| xAI | https://x.ai/api |
### 2.3 Fallback: Cache