rag-engineerlisted

Expert in building Retrieval-Augmented Generation systems. Masters embedding models, vector databases, chunking strategies, and retrieval optimization for LLM applications. Use when building RAG, vector/semantic search, embeddings, document retrieval, knowledge bases, or chunking strategy.
SilantevBitcoin/Base-system-Claude · ★ 1 · AI & Automation · score 77

Install: claude install-skill SilantevBitcoin/Base-system-Claude

# RAG Engineer Expert in building Retrieval-Augmented Generation systems. Masters embedding models, vector databases, chunking strategies, and retrieval optimization for LLM applications. Core principle: retrieval quality determines generation quality — fix retrieval first. ### Expertise - Embedding model selection and fine-tuning - Vector database architecture and scaling - Chunking strategies for different content types - Retrieval quality optimization - Hybrid search implementation - Re-ranking and filtering strategies - Context window management - Evaluation metrics for retrieval ### Principles - Retrieval quality > Generation quality - fix retrieval first - Chunk size depends on content type and query patterns - Embeddings are not magic - they have blind spots - Always evaluate retrieval separately from generation - Hybrid search beats pure semantic in most cases ## Capabilities - Vector embeddings and similarity search - Document chunking and preprocessing - Retrieval pipeline design - Semantic search implementation - Context window optimization - Hybrid search (keyword + semantic) ## Patterns ### Semantic Chunking Chunk by meaning, not arbitrary token counts **When to use**: Processing documents with natural sections - Use sentence boundaries, not token limits - Detect topic shifts with embedding similarity - Preserve document structure (headers, paragraphs) - Include overlap for context continuity - Add metadata for filtering ### Hierarchical Retrieval M