반응형

r스튜디오 4

[R공부] 수치형 변수와 범주형 변수의 차이

두 변수의 가장 큰 차이는 수치형 변수는 사칙연산이 가능하기 때문에 분산 및 표준편차를 확인 가능하다는 점이다. 평균을 구하는 공식? 은 아래와 같다. 여기에서 i는 관측치의 일련번호를 의미하며 x는 관심대상인 수치형 변수이다. 그러므로 xi는 특정 수치형변수의 i번째 관측치라는 뜻을 의미한다. 써메이션 기호는 모든 것을 더하라는 뜻으로 i가 1일때부터 n일때 까지의 모든 합을 더하라는 것으로 평균값(엑스바)는 전체 관측치의 합계를 계산하고 관측치의 개수 N으로 나눈다. 분산의 경우 아래 공식이다. 각각의 관측치에서 평균을 빼게되면 평균보다 큰 관측치의 값은 양이되고 작은 관측치의 값은 음이된다. 거기에 제곱을하면 양수든 음수든 똑같아진다? 평균에서 떨어진 정도를 구하고 제곱을 한뒤 관측치에서 1을 뺀것..

TECH 2021.04.22

R공부_20210408

내가 가지고 있는 데이터를 이용해서 여태까지 배운것을 실습해보려고 한다. (얼마 되지는 않지만....) 하지만 첫 과정부터 난관에 봉착 분명 CSV 파일을 엑셀에서 열었을 때는 위에 내용처럼 정상적인 한글로 불러와지는데 read.csv 명령어를 이용해서 R에서 데이터를 볼때는 1행의 제목부터 한글이 대부분 깨져서 나온다. 왜 이런 현상이 일어나는걸까? 분명 CSV파일을 read 할 때 encoding = 'UTF-8'로 설정해서 불러왔는데 fileencoding = 'euc-kr'을 추가해도 동일한 현상이 일어난다. 방법을 찾음 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ RStudio read.csv() 한글 깨짐 어제, 오늘, RStudio에서 read.csv()로 한글이 들어 있는, CSV파일을 로딩할 때, 계속 한글이..

TECH 2021.04.08

R공부_20210405

install.packages('패키지명') library(패키지명) 패키지를 사용하려면 library 명령어 필요 (R 재시작시) ### 도움말 살펴보기 help(openxlsx) ?read.xlsx() ### Excel 파일 불러오기 read.xlsx('data/test.xlsx') ## 엑셀 내 다른 sheets 불러오기 read.xlsx('파일경로', sheet = 시트 숫자) 불러온 후 꼭 해당 데이터의 이름을 지정해 주어야 불러올 수 있다. sheets2 = read.xlsx('data/test.xlsx', sheet = 2) ## 엑셀 내 시작 row가 특정 열부터 진행되는 경우 read.xlsx('파일경로', startrow = 시작 로우) read.xlsx('data/test.xlsx',..

TECH 2021.04.05

R변수_20210401

지난번 강의를 들으면서 실습했던 내용이다. R변수_20210330 read.csv 파일을 묶어줄 이름 = read.csv("파일경로") head(변수명) 첫 6행의 관측치를 확인한다 tail(변수명) 마지막 6행의 관측치를 확인한다 head or tail(scores, n=3) head/tail 기본 관측행은 6이나 n=N.. lucigun.tistory.com 변수 이름을 바꾸는 것을 기억하던것으로 계속 시도 했는데 names(scores[2:3]) = C('R', "p") 이거로 계속해봤는데 안되고 안되서 실습파일을 다시보니 내가 잘못지정했던게 있었다. 바로 괄호의 위치였다. names(scores)[2:3]= C('R', "p") 괄호안에 있던 대괄호를 옮겨놓으니 잘 작동함. ㅇㅋ summary(변..

TECH 2021.04.01
반응형