본문 바로가기
공부/R & Python

데이터 불러들이기

by 드인 2019. 11. 18.

ㅜㅇ1. 데이터 불러들이기 (csv, txt)

· csv파일 불러들이기 (read.csv) (csv:comma separated value, 데이터 저장시 범용 형태임)

brain<-read.csv("brain2210.csv")

head(brain)

dim(brain)

 

· xls 파일

*.xls 파일인 경우 데이터를 csv로 저장한 다음 read.csv 함수를 사용하여 R데이터로 불러들이는게 편리함

 

· txt 파일 불러들이기 (read, table)

car<-read.table(file="autompg.txt", na=" ", header=TRUE)

                          파일 이름                   첫번째 줄은 변수이름

 

2. 데이터 저장 폴더

· 데이터와 프로그램 저장 폴더 지정(영문으로 폴더 이름 생성)

 예 : /tempstore/moocr

· 현재 프로그램 작업 폴더 (setwd) : 

setwd("D:/tempstore/moocr")

#setwd : set working directory

#brain2210.csv는 D:/tempstore/moocr에 들어있으므로 working directory를 여기로 설정!!

getwd()

brain<-read.csv("brain2210.csv")

head(brain)

dim(brain)

#brain이라는 이름의 R데이터가 생성되어 있음

 

3. 데이터를 불러들일때 tip

· 데이터를 불러들일때 몇가지 tips

1) Working directory를 설정 : setwd("데이터가 저장되어있는 폴더")

2) 데이터를 불러들이고 확인

 (1) head(데이터 이름) : 첫번째 6줄을 프린트해줌

 (2) dim(데이터 이름) : 데이터의 관측치수와 변수의 갯수를 알려줌

 

4. 데이터와 변수이름

· attach 사용

attach(데이터이름) : 데이터이름을 따로 지정하지 않아도 됨

table(brain$sex)

attach(brain)

table(sex)

table(변수) : 빈도 구하기 (male과 female 몇명씩?)

 

5. 데이터분석 활용

· 데이터 알아보기(히스토그램) : hist(변수이름)

· attach(데이터이름) : 현재 세션에서 나오는 변수들은 그 '데이터'의 변수로 인식한다는 의미

· detach(데이터이름) : attach를 풀어줌

 

6. 데이터 불러들이기 (메뉴 선택방식)

· 데이터 불러들이기

Environmenet에서 import Dataset

 

'공부 > R & Python' 카테고리의 다른 글

3-3. R 데이터의 활용 2  (0) 2020.02.12
3-2. R 데이터 활용 1(subset, 내보내기)  (0) 2020.02.12
함수 생성 및 루프  (0) 2019.11.11
벡터와 행렬의 연산  (0) 2019.11.09
객체이름정의와 데이터프레임  (0) 2019.11.09