4. R 그래픽 1
4-1. R그래픽 기초1
1) 데이터의 시각화
2) R 그래프 - 데이터의 분포
(1) 히스토그램 : 1차원(일변량)
- Brain 데이터를 이용한 그래프
setwd("D:/R files/week4_1")
brain<-read.csv(file="brain2210.csv")
head(brain)
dim(brain)
attach(brain)
- 히스토그램 : hist(변수이름)
hist(wt)
hist(wt, col = "lightblue") 색상선택
- 히스토그램 (색과 제목) : hist(변수이름, col="colname", main=" ")
hist(wt, breaks = 10, col = "lightblue", main="Histogram of Brain weight" , xlab="brain weight")
col="collname", main="그림제목"
- 색 (657가지 색)
colors() 모든 색의 이름을 볼 수 있음
grep("blue", colors(), value=TRUE) grep("단어", colors(), value=TRUE) : '단어'가 포함된 색을 검색해줌
- 밀도함수 그려보기
par(mfrow=c(1,1)) 1개의 그림만 넣음
d <- density(brain$wt)
plot(d)
- 그룹별 히스토그램 (동일한 x축, y축 범위) : xlim, ylim
par(mfrow=c(2,1)) par(mfrow=c(2,1)) : 그래프화면의 분할을 행(row)는 2행으로, 열은 1열
brainf<-subset(brain,brain$sex=='f')
hist(brainf$wt, breaks = 12,col = "green", xlim=c(900,1700),ylim=c(0,20),cex=0.7, main="Histogram with Normal Curve (Female)", xlab="brain weight")
brainm<-subset(brain,brain$sex=='m')
hist(brainm$wt, breaks = 12,col = "orange",xlim=c(900,1700),ylim=c(0,20), main="Histogram with Normal Curve (Male)", xlab="brain weight")
(2) 상자그림 : 1차원(데이터의 분포 파악)
(3) 막대그림 : 1차원(범주형데이터의 빈도분포)
(4) 파이차트 : 1차원(각 범주별 비율을 그림으로)
(5) 산점도 : 2차원 (x와 y간의 관계를 해석)
'공부 > R & Python' 카테고리의 다른 글
4-3. R 그래픽 기초 3 (산점도) (0) | 2020.02.13 |
---|---|
4-2 R 그래픽 기초 2 (상자그림, 파이차트) (0) | 2020.02.13 |
3-4. 여러형태의 DB다루기 (Excel 통합파일, DBF, SQL) (0) | 2020.02.13 |
3-3. R 데이터의 활용 2 (0) | 2020.02.12 |
3-2. R 데이터 활용 1(subset, 내보내기) (0) | 2020.02.12 |