반응형

RStudio 5

[R공부] 수치형 변수와 범주형 변수의 차이

두 변수의 가장 큰 차이는 수치형 변수는 사칙연산이 가능하기 때문에 분산 및 표준편차를 확인 가능하다는 점이다. 평균을 구하는 공식? 은 아래와 같다. 여기에서 i는 관측치의 일련번호를 의미하며 x는 관심대상인 수치형 변수이다. 그러므로 xi는 특정 수치형변수의 i번째 관측치라는 뜻을 의미한다. 써메이션 기호는 모든 것을 더하라는 뜻으로 i가 1일때부터 n일때 까지의 모든 합을 더하라는 것으로 평균값(엑스바)는 전체 관측치의 합계를 계산하고 관측치의 개수 N으로 나눈다. 분산의 경우 아래 공식이다. 각각의 관측치에서 평균을 빼게되면 평균보다 큰 관측치의 값은 양이되고 작은 관측치의 값은 음이된다. 거기에 제곱을하면 양수든 음수든 똑같아진다? 평균에서 떨어진 정도를 구하고 제곱을 한뒤 관측치에서 1을 뺀것..

TECH 2021.04.22

[R공부] 20210419_수치형변수 범주형변수

변수의 형식의 이해, 범주형 변수의 요과 시각화 변수와 관측치로 구성된다. 변수는 X축,Y축이고, 관측치는 X/Y축에 포함되는 벡터값이다. 데이터분석은 관측치 중심, 변수중심으로 나누어진다. 변수의 형식에 따라서 어떤 분석방법을 적용하는지 두변수의 관계에 따라서 어떤 관계를 가지고 있는지에 따라서 분석방법을 결젙하는것이 좋다. ex)성별/ 연령대의 경우 한정적인 값을 가지며, 매출금액은 다양하게 될 수 있다. 변수는 점주형 수치형 두개로 나누어진다. 범주형 변수는 관측치들이 몇개의 정해진 값만 가질 수 있음 수치형은 다양한 숫자값을 가질 수 있음 주소등은 무잔형, 날짜는 날짜형 변수로 저장한다. - 전처리를 통해 시군구, 요일, 시간차 등 파생변수를 만들어 활용하는 경우가 대부분이다. 데이터분석의 목적은..

ITEMS 2021.04.19

R_지난강의 실습해보기

데이터불러오기 read.csv('경로및파일명') read.csv('data/pop_seoul_euckr.csv') 불러온 데이터를 변수로 지정하기 지정할 변수명 = read.csv('경로및파일명') pop = read.csv('data/pop_seoul_euckr.csv') 첫/끝 N개의 벡터값 살펴보기 head(변수명) tail(변수명) 변수명에 ,N=숫자를 입력하면 원하는 만큼만 노출시켜줌, 기본은 6개로 세팅됨 head(pop) tail(pop) tail(pop, n=3) 변수이름확인 names(변수명) names(pop) 변수의 이름바꾸기 names(변수명)[바꿀변수의 범위] = ('바꿀변수이름') 단, 연수된 변수의이름을 바꿀 경우 [시작:끝] = c('', '', '')으로 묶어서 함수진행 불..

TECH 2021.04.02

R변수_20210401

지난번 강의를 들으면서 실습했던 내용이다. R변수_20210330 read.csv 파일을 묶어줄 이름 = read.csv("파일경로") head(변수명) 첫 6행의 관측치를 확인한다 tail(변수명) 마지막 6행의 관측치를 확인한다 head or tail(scores, n=3) head/tail 기본 관측행은 6이나 n=N.. lucigun.tistory.com 변수 이름을 바꾸는 것을 기억하던것으로 계속 시도 했는데 names(scores[2:3]) = C('R', "p") 이거로 계속해봤는데 안되고 안되서 실습파일을 다시보니 내가 잘못지정했던게 있었다. 바로 괄호의 위치였다. names(scores)[2:3]= C('R', "p") 괄호안에 있던 대괄호를 옮겨놓으니 잘 작동함. ㅇㅋ summary(변..

TECH 2021.04.01

R 공부_20210329

통계량 - 데이터로부터 계산된 숫자 기술 통계량 - 변수나 변수의 관계 등 데이터의 특성을 설명하는 통계량 탐색적 분석에서 매우 중요 요약 - 데이터의 정보를 인식 가능한 수준으로 줄이는과정 그룹별 관측치 수, 평균, 최댓값 계산등 단순 숫자요약 모델 - 정해진 알고리즘에 따라 데이터 속 변수와 관측치 간 관계를 확인 가능성을 수치화한 확률로 설명 R 완전 기초 R에서 활당 연산자는 = 또는 paste 글자 결합 시 공백이 발생한다 paste0('gender:', mydata$b1) ==> paste0 글자 결합 시 공백이 발생하지 않음

TECH 2021.03.29
반응형