TECH

[R공부] 수치형 변수의 요약과 시각화

AKA.DM 2021. 4. 21. 08:37
반응형

수치형 변수의 요약과 시각화

관측치들이 다양한 숫자 값을 가짐
합계 - 평균, 분산 등 관측치의 전반적인 특성 확인
정렬 - 최소값, 최대값 등 관측치들의 전반적인 위치 확인

order와 sorting
관측치의 순서를 정렬

1. 분위수 활용
 - 분포를 확인할 수 있음
 - 백분위수 : 관측치를 1%를 나누는 101개 숫자(0% ~ 100%)
 - 사분위수 : 관측치를 25%씩 나누는 5개 숫자(0%, 25%, 50%, 75%, 100%)
  -- 5숫자 요약 사분위를 계산하는 요약
  --- 최소값 : 0%
  --- Q1 : 25%
  --- 중앙값 : 50%
  --- Q2 : 75%
  --- 최대값 : 100%
 - 상자그림(box plot)
  --- 사분위를 표현한 그림
  --- 4개구간 길이차이를 확인 
  --- 수치형 변수의 전반적인 분포 확인 

 - 도수분포표 
 -- 수치형 변수를 적절한 구간 값을 활용하여 구간화
 -- 수치형 변수에서 관측치 분포 확인

 - 히스토그램
 -- 도수 분표표를 표현한 그림
 -- 각 구간의 비중을 확인

 상자그림과 히스토그램의 차이점


 - 3개 이상 비교 그룹이 있는 경우 상자그림을 활용



반응형