EDA
- 본격적인 분석에 앞서 데이터에 대한 전반적인 이해를 하기 위한 과정
- 주어진 데이터를 활용해서 기술통계 및 간단한 그래프를 그려보며 내가 세운 가설 혹은 앞으로 세울 가설에 대한 윤곽을 정해가는 저랓
- EDA와 데이터 정제는 거의 동시에 이루어짐
EDA & 데이터 정제 절차
데이터 확인 | 데이터 불러오기 데이터 사전 데이터 유형 확인 |
데이터 정제 | 사용하지 않는 열 삭제 열 이름 변경 중복 행 삭제 결측치 처리 이상치 처리 |
변수 분포 확인 | 종속변수 분포 단일 독립변수 종속변수와 독립변수 관계 |