본문 바로가기
공부/R & Python

4-1. R그래픽 기초1

by 드인 2020. 2. 13.

4. R 그래픽 1

4-1. R그래픽 기초1


1) 데이터의 시각화

 

2) R 그래프 - 데이터의 분포

(1) 히스토그램 : 1차원(일변량)

- Brain 데이터를 이용한 그래프

setwd("D:/R files/week4_1")

brain<-read.csv(file="brain2210.csv")

head(brain)
dim(brain)

attach(brain)

 

- 히스토그램 : hist(변수이름)

hist(wt)

hist(wt, col = "lightblue")  색상선택

 

- 히스토그램 (색과 제목) : hist(변수이름, col="colname", main=" ")

hist(wt, breaks = 10, col = "lightblue", main="Histogram of Brain weight" , xlab="brain weight")

col="collname", main="그림제목"

 

- 색 (657가지 색)

colors()                                      모든 색의 이름을 볼 수 있음

grep("blue", colors(), value=TRUE)    grep("단어", colors(), value=TRUE) : '단어'가 포함된 색을 검색해줌

 

- 밀도함수 그려보기

par(mfrow=c(1,1))        1개의 그림만 넣음
d <- density(brain$wt)
plot(d)

 

- 그룹별 히스토그램 (동일한 x축, y축 범위) : xlim, ylim

par(mfrow=c(2,1))                        par(mfrow=c(2,1)) : 그래프화면의 분할을 행(row)는 2행으로, 열은 1열
brainf<-subset(brain,brain$sex=='f') 
hist(brainf$wt, breaks = 12,col = "green", xlim=c(900,1700),ylim=c(0,20),cex=0.7, main="Histogram with Normal Curve (Female)", xlab="brain weight")

brainm<-subset(brain,brain$sex=='m') 
hist(brainm$wt, breaks = 12,col = "orange",xlim=c(900,1700),ylim=c(0,20), main="Histogram with Normal Curve (Male)", xlab="brain weight")

 

(2) 상자그림 : 1차원(데이터의 분포 파악)

(3) 막대그림 : 1차원(범주형데이터의 빈도분포)

(4) 파이차트 : 1차원(각 범주별 비율을 그림으로)

(5) 산점도 : 2차원 (x와 y간의 관계를 해석)