본문 바로가기
공부/R & Python

객체이름정의와 데이터프레임

by 드인 2019. 11. 9.

2-2. 객체이름정의와 데이터프레임

1. 객체이름정의 

 · 벡터이름주기

gender<-c(0,1)

names(gender)<-c("female", "male")

gender

 · 범주형변수 생성(factor 사용)

size<-c("S", "M", "L", "XL")

#size 라는 변수를 생성 : (S, M, L, XL)의 값을 갖는 범주형변수(factor) 생성

size_factor(size)

#factor()는 범주형변수로 정의하는 함수

size_factor

#출력에는 순서가 없음!(기본으로 알파벳 순서로 출력)

is.factor(size_factor)

#size_factor은 범주형 변수

 · 범주형변수 생성(factor 사용) - 순서를 정의한 factor생성

#size_factor3 : (S, M, L, XL)의 값을 갖으며, S<M<L<XL의 순서가 정의된 factor!!

size_factor3<-factor(size, ordered = TRUE, levels = c("S", "M", "L", "XL"))

size_factor3

 · 행렬에 이름주기 (dimnames, colnames, rownames)

x<-matrix(rnorm(12), nrow=4)

#정규분포(평균=0, 편차=1)에서 12개의 객체를 임의적으로 뽑아서 4*3행렬을 생성

#rnorm(random sampling from normal distribution)

x

dim(x)

#행렬의 차원 알아보기

dimnames(x)[[2]]<=paste("x", 1:3, sep="")

#dimnames를 사용:X의 열([2]객체)에 x1, x2, x3 이름을 부여함

x

y<-matrix(rnorm(12),nrow=4)

#colnames를 사용해도 같은 결과

colname(y) <- c("y1", "y2", "y3")

y

dimnames(x)[[1]]<-paste("id",1:4,sep="")

#dimnames를 사용 : X의 행([1]객체)에 id1-id4 이름을 부여함

#rownames을 사용해도 같은 결과 

x

 

2. 행렬과 데이터 프레임

 · 행렬과 데이터 프레임(as.data.frame, is.data.frame)

is.data.frame(x)

#행렬(x)는 데이터 프레임이 아님

 · 행렬과 데이터 프레임의 차이

데이터 프레임은 객체값들을 행렬로 저장할 뿐 아니라 변수명, 관측치번호 등 여러가지 정보를 가지는 객체. 따라서 행렬을 데이터 프레임으로 인식하기 위해서는 as.data.frame로 정의 필요

x<-as.data.frame(x)

#행렬(x)를 데이터 프레임(x)로 저장

is.data.frame(x)

#x는 데이터 프레임이다.

 · 데이터 프레임으로 정의 -> 각 열은 변수열, 각 행은 관측치

x$x1

#x라는 데이터에서 x1 변수값들을 보여줌

mean(x$x1)

sd(x$x1)

#x1의 평균, 편차

summary(x)

#데이터 x의 요약통계량

 · 생성된 데이터 확인

환경창의 데이터 x를 더블클릭

 

'공부 > R & Python' 카테고리의 다른 글

함수 생성 및 루프  (0) 2019.11.11
벡터와 행렬의 연산  (0) 2019.11.09
벡터, 행렬의 연산 및 함수  (0) 2019.09.02
파이썬(5)  (0) 2019.08.31
파이썬(4)  (0) 2019.08.30