← ClaudeAtlas

clinical-eda-reportlisted

의학연구 tabular 데이터(.xlsx/.csv)에 대해 한국어 단일 HTML EDA 리포트를 자동 생성하는 스킬. 행이 관찰 단위(환자·내원·병변·검체 등), 열이 변수인 모든 의학연구 데이터셋이 대상이며 연구 디자인(후향/전향 코호트, RCT·임상시험, case-control, cross-sectional, registry, survey 등)을 가리지 않는다. n·변수 타입별 요약, 결측 패턴, 분포 플롯, 이상치(implausible value) 감지, 선택적 소그룹별 Table 1, 상관관계 heatmap, VIF를 모두 한 파일에 임베딩한다. 사용자가 임상연구·관찰연구·임상시험·환자 데이터·registry·연구 데이터셋·엑셀/CSV 파일을 업로드하면서 "EDA", "데이터 탐색", "탐색적 분석", "기초통계", "Table 1", "결측 보고", "분포 확인", "데이터 살펴봐", "데이터 점검" 같은 표현을 사용하면 적극적으로 트리거하라. 단순 통계 분석(t-test, Cox regression 등)이나 가설 검정 요청, 시각화 1개만 요청한 경우는 대상이 아니다. raw 영상(DICOM/JPEG)·ECG waveform·자연어 free text·omics 매트릭스 같은 비-tabular 데이터는 대상이 아니다. clinical-research-harness:data-inspect와 달리 사전등록·검정력 평가 없이 독립적으로 동작한다.
JeonKH81/MediStat-EDA · ★ 1 · Data & Documents · score 62
Install: claude install-skill JeonKH81/MediStat-EDA
# Clinical EDA Report 의학연구 tabular 데이터(행 = 관찰 단위, 열 = 변수)를 받아, **단일 한국어 HTML 대시보드 리포트**를 생성한다. 연구 디자인(후향/전향 코호트, RCT·임상시험, case-control, cross-sectional, registry 등)이나 관찰 단위(환자·내원·병변·검체 등)에 구애받지 않으며, 행 단위가 무엇인지는 리포트 상단에 함께 명시한다. 결과 리포트는 다음 기능을 갖춘 단일 HTML 파일이다: - **상단 KPI 카드 6장** — 관찰 수, 변수 수, 전체 결측률, 고결측 변수 수, 이상치 후보 수, VIF≥10 변수 수. 각 카드를 클릭하면 해당 섹션으로 부드럽게 스크롤된다 - **좌측 sticky 사이드바** + **scrollspy** — 현재 보이는 섹션이 자동으로 highlight - **인터랙티브 SVG 분포 플롯** — 막대 위에 마우스를 올리면 구간/빈도/% 툴팁 표시. Vector 출력이라 확대·인쇄·다크모드 모두 깔끔 - **다크모드 토글** — 헤더 우상단 버튼. `prefers-color-scheme` 자동 감지 + `localStorage` 영속화 (실패 시 graceful fallback) - **인쇄·PDF 버튼** — 사이드바/컨트롤 자동 숨김, 강제 라이트 모드, 패널 단위 page-break 컨트롤 - **입력 파일의 SHA-256 short hash(12자)** 푸터에 표시 — 같은 파일로 만든 두 리포트의 동일성 검증용 모든 그래프, 폰트, 차트, JS는 base64/인라인으로 임베딩되므로 받는 사람은 파일 하나만 열면 된다 (외부 의존 0). ## 언제 이 스킬을 쓰는가 - 새로 받은 연구 데이터셋(.xlsx/.csv)의 전반적 상태를 빠르게 파악하고 싶을 때 — 후향/전향 코호트, RCT·임상시험, case-control, cross-sectional, registry, survey 등 디자인 무관 - IRB 제출 전·연구계획서 작성 전에 baseline characteristics와 결측 현황을 점검할 때 - 협력기관에서 받은 데이터셋의 품질(이상치, 결측, 코딩 오류)을 검수할 때 - 임상시험 database lock 후·sub-study 시작 전 데이터셋 sanity check 가설검정·생존분석 같은 inferential analysis는 이 스킬의 대상이 아니다. 그쪽은 `survival-analysis` 또는 `clinical-research-harness:stat-analysis`를 안내하라. **대상이 아닌 데이터**: raw 영상(DICOM, JPEG/PNG 등 이미지 자체), ECG/PPG waveform 시그널, 자연어 임상 기록 free text, 고차원 omics(genome/transcriptome) 매트릭스는 별도 도구가 필요하다. Long-format longitudinal 데이터(환자당 여러 행)는 동작은 하지만 분포·요약통계가 "환자"가 아닌 "관찰 단위(행)" 기준임을 사용자가 인지해야