llm-evaluatelisted

Evaluate LLM models for cost/performance ratio. Fetches current pricing and recommends optimal model for your use case. Use during project init or when optimizing costs.
lucidlabs-hq/agent-kit · ★ 1 · AI & Automation · score 53

Install: claude install-skill lucidlabs-hq/agent-kit

# LLM Model Evaluation Evaluiert LLM-Modelle basierend auf aktuellem Preis/Leistungs-Verhältnis. --- ## Wann nutzen? - Während `/init-project` bei der Komplexitätsbewertung - Bei Kosten-Optimierung bestehender Projekte - Wenn neue Modelle erscheinen (regelmäßig checken) - Vor größeren Production-Deployments --- ## Step 1: Use Case verstehen Falls kein Argument übergeben, frage: ``` Was ist dein Use Case? Beispiele: • "Chat-Bot für Kundenservice" (High-Volume, schnelle Antworten) • "Dokumenten-Analyse" (Langer Context, Reasoning) • "Code-Generierung" (Präzision wichtig) • "GDPR-konforme EU-App" (Compliance) • "Budget-Projekt" (Kosten minimieren) ``` --- ## Step 2: Aktuelle Preise holen **WICHTIG:** Preise ändern sich häufig. Hole aktuelle Daten. ### 2.1 Web Search für aktuelle Preise Suche nach aktuellen Preisen mit WebSearch: ``` Query: "[Provider] API pricing 2026" ``` Für jeden Provider: - Anthropic Claude pricing - OpenAI GPT pricing - Google Gemini pricing - DeepSeek pricing - xAI Grok pricing - Mistral pricing ### 2.2 Pricing Endpoints (falls verfügbar) Einige Provider haben öffentliche Pricing-Pages: | Provider | Pricing URL | |----------|-------------| | Anthropic | https://www.anthropic.com/pricing | | OpenAI | https://openai.com/api/pricing | | Google | https://ai.google.dev/pricing | | DeepSeek | https://platform.deepseek.com/api-docs/pricing | | Mistral | https://mistral.ai/technology/#pricing | | xAI | https://x.ai/api | ### 2.3 Fallback: Cache