2-2. 객체이름정의와 데이터프레임
1. 객체이름정의
· 벡터이름주기
gender<-c(0,1)
names(gender)<-c("female", "male")
gender
· 범주형변수 생성(factor 사용)
size<-c("S", "M", "L", "XL")
#size 라는 변수를 생성 : (S, M, L, XL)의 값을 갖는 범주형변수(factor) 생성
size_factor(size)
#factor()는 범주형변수로 정의하는 함수
size_factor
#출력에는 순서가 없음!(기본으로 알파벳 순서로 출력)
is.factor(size_factor)
#size_factor은 범주형 변수
· 범주형변수 생성(factor 사용) - 순서를 정의한 factor생성
#size_factor3 : (S, M, L, XL)의 값을 갖으며, S<M<L<XL의 순서가 정의된 factor!!
size_factor3<-factor(size, ordered = TRUE, levels = c("S", "M", "L", "XL"))
size_factor3
· 행렬에 이름주기 (dimnames, colnames, rownames)
x<-matrix(rnorm(12), nrow=4)
#정규분포(평균=0, 편차=1)에서 12개의 객체를 임의적으로 뽑아서 4*3행렬을 생성
#rnorm(random sampling from normal distribution)
x
dim(x)
#행렬의 차원 알아보기
dimnames(x)[[2]]<=paste("x", 1:3, sep="")
#dimnames를 사용:X의 열([2]객체)에 x1, x2, x3 이름을 부여함
x
y<-matrix(rnorm(12),nrow=4)
#colnames를 사용해도 같은 결과
colname(y) <- c("y1", "y2", "y3")
y
dimnames(x)[[1]]<-paste("id",1:4,sep="")
#dimnames를 사용 : X의 행([1]객체)에 id1-id4 이름을 부여함
#rownames을 사용해도 같은 결과
x
2. 행렬과 데이터 프레임
· 행렬과 데이터 프레임(as.data.frame, is.data.frame)
is.data.frame(x)
#행렬(x)는 데이터 프레임이 아님
· 행렬과 데이터 프레임의 차이
데이터 프레임은 객체값들을 행렬로 저장할 뿐 아니라 변수명, 관측치번호 등 여러가지 정보를 가지는 객체. 따라서 행렬을 데이터 프레임으로 인식하기 위해서는 as.data.frame로 정의 필요
x<-as.data.frame(x)
#행렬(x)를 데이터 프레임(x)로 저장
is.data.frame(x)
#x는 데이터 프레임이다.
· 데이터 프레임으로 정의 -> 각 열은 변수열, 각 행은 관측치
x$x1
#x라는 데이터에서 x1 변수값들을 보여줌
mean(x$x1)
sd(x$x1)
#x1의 평균, 편차
summary(x)
#데이터 x의 요약통계량
· 생성된 데이터 확인
환경창의 데이터 x를 더블클릭
'공부 > R & Python' 카테고리의 다른 글
함수 생성 및 루프 (0) | 2019.11.11 |
---|---|
벡터와 행렬의 연산 (0) | 2019.11.09 |
벡터, 행렬의 연산 및 함수 (0) | 2019.09.02 |
파이썬(5) (0) | 2019.08.31 |
파이썬(4) (0) | 2019.08.30 |