data-exploration-visualization

Solid

自动化数据探索和可视化工具,提供从数据加载到专业报告生成的完整EDA解决方案。支持多种图表类型、智能数据诊断、建模评估和HTML报告生成。适用于医疗、金融、电商等领域的数据分析项目。

AI & Automation 2,279 stars 168 forks Updated 3 weeks ago Apache-2.0

Install

View on GitHub

Quality Score: 94/100

Stars 20%
100
Recency 20%
90
Frontmatter 20%
70
Documentation 15%
100
Issue Health 10%
50
License 10%
100
Description 5%
100

Skill Content

# 数据探索可视化技能 ## 技能概述 数据探索可视化技能是一个基于《数据分析咖哥十话》第2课理论的自动化EDA工具包,提供从数据加载到专业分析报告生成的完整解决方案。该技能集成了最先进的数据探索、可视化和机器学习技术,帮助用户快速深入理解数据特征和规律。 ## 核心功能 ### 🔍 智能数据探索 - **自动数据诊断**: 检测数据质量问题、异常值和缺失值模式 - **统计描述分析**: 生成全面的统计摘要和分布特征 - **相关性分析**: 识别特征间关系和依赖模式 - **数据质量报告**: 专业级数据质量评估和建议 ### 📊 专业可视化生成 - **分布可视化**: 直方图、密度图、小提琴图、QQ图 - **统计可视化**: 箱线图、误差条图、置信区间图 - **关系可视化**: 散点图、热图、配对图、3D散点图 - **专门图表**: ROC曲线、混淆矩阵、特征���要性图 - **交互式图表**: Plotly驱动的动态可视化 ### 🏥 医疗数据专精 - **医疗编码支持**: ICD-10、SNOMED CT等医疗标准 - **生物标记物分析**: 专门的医学指标处理 - **诊断模型构建**: 医疗预测模型和评估 - **医学可解释性**: 符合医学实践的解释框架 ### 🤖 自动化建模评估 - **多算法支持**: 逻辑回归、随机森林、XGBoost、神经网络 - **自动特征工程**: 特征选择、转换和优化 - **超参数调优**: 网格搜索和贝叶斯优化 - **模型可解释性**: SHAP值、特征重要性、部分依赖图 ### 📋 专业报告生成 - **HTML报告**: 可发表级交互式分析报告 - **PDF导出**: 高质量文档格式输出 - **Markdown支持**: 轻量级报告格式 - **自定义模板**: 可配置的报告模板系统 ## 使用场景 ### 🏥 医疗健康领域 - **疾病预测**: 基于临床数据的疾病风险预测 - **诊断辅助**: 医学影像和检验结果分析 - **流行病学研究**: 疫情数据分析和趋势预测 - **临床试验**: 试验数据统计分析和可视化 ### 💰 金融风控领域 - **信用评估**: 个人和企业信用风险建模 - **欺诈检测**: 异常交易模式识别 - **投资分析**: 市场趋势和风险评估 - **合规报告**: 监管要求的分析报告 ### 🛒 电商零售领域 - **用户分析**: 客户行为和偏好分析 - **销售预测**: 销量预测和库存优化 - **推荐系统**: 个性化推荐算法评估 - **市场细分**: 客户群体分析和画像 ### 🎓 科研教育领域 - **学术研究**: 数据驱动的学术研究支持 - **教学案例**: 数据分析教学和实践 - **论文写作**: 研究数据分析和图表制作 - **技能培训**: 数据科学技能培训工具 ## 工具使用指南 ### 快速开始 1. **基础数据探索** ```python from scripts.eda_analyzer import EDAAnalyzer # 初始化分析器 analyzer = EDAAnalyzer() # 加载数据并自动分析 data = analyzer.load_data('data.csv') report = analyzer.auto_eda(data) ``` 2. **可视化生成** ...

Details

Author
foryourhealth111-pixel
Repository
foryourhealth111-pixel/Vibe-Skills
Created
3 months ago
Last Updated
3 weeks ago
Language
Python
License
Apache-2.0

Similar Skills

Semantically similar based on skill content — not just same category

Data & Documents Listed

eda-explorer

Use this skill when the user uploads or references a tabular dataset (CSV, Excel, Parquet, TSV) and asks to explore, profile, summarize, understand, or do EDA on it. Triggers include "explore this dataset", "what's in this data", "EDA on", "profile this", "describe this dataset", "tell me about these data", "fais une exploration", "profile-moi", "fais l'EDA". Generates a standardized 9-section EDA report covering shape, schema, missing values, descriptive statistics, distributions, correlations, outliers, a data quality score, and recommendations.

0 Updated 1 weeks ago
RAFCERAY
AI & Automation Listed

light-result-analysis

对执行出来的结果、实验数据、模型输出、图表结果进行详细专业深入的分析。当用户实验跑完、需要解读数据、问"这些结果说明什么"时使用。不只描述好坏,而是解释为什么、哪些结果证明方法有效、哪些暴露问题、哪些异常需排查、哪些规律可成为论文亮点、哪些需补充实验。

77 Updated today
Light0305
Data & Documents Listed

exploratory-data-analysis

Perform comprehensive exploratory data analysis on scientific data files across 200+ file formats. This skill should be used when analyzing any scientific data file to understand its structure, content, quality, and characteristics. Automatically detects file type and generates detailed markdown reports with format-specific analysis, quality metrics, and downstream analysis recommendations. Covers chemistry, bioinformatics, microscopy, spectroscopy, proteomics, metabolomics, and general scientific data formats.

3 Updated 4 days ago
fmschulz