ㅜㅇ1. 데이터 불러들이기 (csv, txt)
· csv파일 불러들이기 (read.csv) (csv:comma separated value, 데이터 저장시 범용 형태임)
brain<-read.csv("brain2210.csv")
head(brain)
dim(brain)
· xls 파일
*.xls 파일인 경우 데이터를 csv로 저장한 다음 read.csv 함수를 사용하여 R데이터로 불러들이는게 편리함
· txt 파일 불러들이기 (read, table)
car<-read.table(file="autompg.txt", na=" ", header=TRUE)
파일 이름 첫번째 줄은 변수이름
2. 데이터 저장 폴더
· 데이터와 프로그램 저장 폴더 지정(영문으로 폴더 이름 생성)
예 : /tempstore/moocr
· 현재 프로그램 작업 폴더 (setwd) :
setwd("D:/tempstore/moocr")
#setwd : set working directory
#brain2210.csv는 D:/tempstore/moocr에 들어있으므로 working directory를 여기로 설정!!
getwd()
brain<-read.csv("brain2210.csv")
head(brain)
dim(brain)
#brain이라는 이름의 R데이터가 생성되어 있음
3. 데이터를 불러들일때 tip
· 데이터를 불러들일때 몇가지 tips
1) Working directory를 설정 : setwd("데이터가 저장되어있는 폴더")
2) 데이터를 불러들이고 확인
(1) head(데이터 이름) : 첫번째 6줄을 프린트해줌
(2) dim(데이터 이름) : 데이터의 관측치수와 변수의 갯수를 알려줌
4. 데이터와 변수이름
· attach 사용
attach(데이터이름) : 데이터이름을 따로 지정하지 않아도 됨
table(brain$sex)
attach(brain)
table(sex)
table(변수) : 빈도 구하기 (male과 female 몇명씩?)
5. 데이터분석 활용
· 데이터 알아보기(히스토그램) : hist(변수이름)
· attach(데이터이름) : 현재 세션에서 나오는 변수들은 그 '데이터'의 변수로 인식한다는 의미
· detach(데이터이름) : attach를 풀어줌
6. 데이터 불러들이기 (메뉴 선택방식)
· 데이터 불러들이기
Environmenet에서 import Dataset
'공부 > R & Python' 카테고리의 다른 글
3-3. R 데이터의 활용 2 (0) | 2020.02.12 |
---|---|
3-2. R 데이터 활용 1(subset, 내보내기) (0) | 2020.02.12 |
함수 생성 및 루프 (0) | 2019.11.11 |
벡터와 행렬의 연산 (0) | 2019.11.09 |
객체이름정의와 데이터프레임 (0) | 2019.11.09 |