반응형
수치형 변수의 요약과 시각화
관측치들이 다양한 숫자 값을 가짐
합계 - 평균, 분산 등 관측치의 전반적인 특성 확인
정렬 - 최소값, 최대값 등 관측치들의 전반적인 위치 확인
order와 sorting
관측치의 순서를 정렬
1. 분위수 활용
- 분포를 확인할 수 있음
- 백분위수 : 관측치를 1%를 나누는 101개 숫자(0% ~ 100%)
- 사분위수 : 관측치를 25%씩 나누는 5개 숫자(0%, 25%, 50%, 75%, 100%)
-- 5숫자 요약 사분위를 계산하는 요약
--- 최소값 : 0%
--- Q1 : 25%
--- 중앙값 : 50%
--- Q2 : 75%
--- 최대값 : 100%
- 상자그림(box plot)
--- 사분위를 표현한 그림
--- 4개구간 길이차이를 확인
--- 수치형 변수의 전반적인 분포 확인
- 도수분포표
-- 수치형 변수를 적절한 구간 값을 활용하여 구간화
-- 수치형 변수에서 관측치 분포 확인
- 히스토그램
-- 도수 분표표를 표현한 그림
-- 각 구간의 비중을 확인
상자그림과 히스토그램의 차이점
- 3개 이상 비교 그룹이 있는 경우 상자그림을 활용
반응형
'TECH' 카테고리의 다른 글
[R공부] 수치형 변수와 범주형 변수의 차이 (0) | 2021.04.22 |
---|---|
[InitiativeQ] Q코인 Refer Code (0) | 2021.04.22 |
[인프런] UI 디자인 툴 TOP3 비교 (0) | 2021.04.21 |
[바이라인네트워크] [커머스BN] 카카오가 ‘지그재그’를 인수하면 얻는 것 (0) | 2021.04.19 |
[1+1] 어린이 토끼 캐릭터 무전기 (핑크+블루) - 충전식 / 워키토키 (0) | 2021.04.15 |