반응형

R 4

[R공부] 수치형 변수의 요약과 시각화

수치형 변수의 요약과 시각화 관측치들이 다양한 숫자 값을 가짐 합계 - 평균, 분산 등 관측치의 전반적인 특성 확인 정렬 - 최소값, 최대값 등 관측치들의 전반적인 위치 확인 order와 sorting 관측치의 순서를 정렬 1. 분위수 활용 - 분포를 확인할 수 있음 - 백분위수 : 관측치를 1%를 나누는 101개 숫자(0% ~ 100%) - 사분위수 : 관측치를 25%씩 나누는 5개 숫자(0%, 25%, 50%, 75%, 100%) -- 5숫자 요약 사분위를 계산하는 요약 --- 최소값 : 0% --- Q1 : 25% --- 중앙값 : 50% --- Q2 : 75% --- 최대값 : 100% - 상자그림(box plot) --- 사분위를 표현한 그림 --- 4개구간 길이차이를 확인 --- 수치형 변수의..

TECH 2021.04.21

R_지난강의 실습해보기

데이터불러오기 read.csv('경로및파일명') read.csv('data/pop_seoul_euckr.csv') 불러온 데이터를 변수로 지정하기 지정할 변수명 = read.csv('경로및파일명') pop = read.csv('data/pop_seoul_euckr.csv') 첫/끝 N개의 벡터값 살펴보기 head(변수명) tail(변수명) 변수명에 ,N=숫자를 입력하면 원하는 만큼만 노출시켜줌, 기본은 6개로 세팅됨 head(pop) tail(pop) tail(pop, n=3) 변수이름확인 names(변수명) names(pop) 변수의 이름바꾸기 names(변수명)[바꿀변수의 범위] = ('바꿀변수이름') 단, 연수된 변수의이름을 바꿀 경우 [시작:끝] = c('', '', '')으로 묶어서 함수진행 불..

TECH 2021.04.02

R변수_20210401

지난번 강의를 들으면서 실습했던 내용이다. R변수_20210330 read.csv 파일을 묶어줄 이름 = read.csv("파일경로") head(변수명) 첫 6행의 관측치를 확인한다 tail(변수명) 마지막 6행의 관측치를 확인한다 head or tail(scores, n=3) head/tail 기본 관측행은 6이나 n=N.. lucigun.tistory.com 변수 이름을 바꾸는 것을 기억하던것으로 계속 시도 했는데 names(scores[2:3]) = C('R', "p") 이거로 계속해봤는데 안되고 안되서 실습파일을 다시보니 내가 잘못지정했던게 있었다. 바로 괄호의 위치였다. names(scores)[2:3]= C('R', "p") 괄호안에 있던 대괄호를 옮겨놓으니 잘 작동함. ㅇㅋ summary(변..

TECH 2021.04.01

R 공부_20210329

통계량 - 데이터로부터 계산된 숫자 기술 통계량 - 변수나 변수의 관계 등 데이터의 특성을 설명하는 통계량 탐색적 분석에서 매우 중요 요약 - 데이터의 정보를 인식 가능한 수준으로 줄이는과정 그룹별 관측치 수, 평균, 최댓값 계산등 단순 숫자요약 모델 - 정해진 알고리즘에 따라 데이터 속 변수와 관측치 간 관계를 확인 가능성을 수치화한 확률로 설명 R 완전 기초 R에서 활당 연산자는 = 또는 paste 글자 결합 시 공백이 발생한다 paste0('gender:', mydata$b1) ==> paste0 글자 결합 시 공백이 발생하지 않음

TECH 2021.03.29
반응형