공부83 11-3. 서포트벡터머신 3 (Support Vector Machine) 11-3. 서포트벡터머신 3 (Support Vector Machine) 1) Breast Cancer 데이터 설명 - Breast Cancer Wisconsin (Diagnostic) Data Set 세침홉인 세포검사를 통해 얻은 683개의 유방조직의 9개 특성을 나타냄 자료 출처 : UCI Machine Learning Repository 2) 서포트벡터머신 패키지와 함수 - 서포트벡터머신을 수행하기 위한 패키지 : e1071 - 오분류율 교차표 생성을 위한 패키지 : caret cancer 2020. 3. 4. 11-2. 서포트벡터머신 2 (Support Vector Machine) 11-2. 서포트벡터머신 2 (Support Vector Machine) 1) 서포트벡터머신 (kernel 함수) - 커널이란? - 서포트벡터머신을 수행하기 위한 패키지 : e1071 - 오분류율 교차표(confusion matrix) 생성을 위한 패키지 : caret library (e1071) install.packages("caret") library(caret) - Iris 데이터 (학습데이터와 검증데이터의 분할) set.seed(1000) N=nrow(iris) tr.idx=sample(1:N, size=N*2/3, replace=FALSE) 데이터분할 (학습데이터 2/3, 검증데이터 1/3) y=iris[,5] train=iris[tr.idx,] test=iris[-tr.idx,] train(.. 2020. 3. 4. 11-1. 서포트벡터머신 1 (Sipport Vector MAchine) 11-1. 서포트벡터머신 1 (Sipport Vector MAchine) 1) 서포트벡터머신 (Support Vector Machine) - 선형 SVM - 비선형 SVM 2) iris 데이터 설명 - iris 데이터 (iris.csv) 3) 서포트벡터머신 패키지와 함수 - 서포트벡터머신을 수행하기 위한 패키지 : e1071 - 서포트벡터머신 함수 : svm install.packages("e1071") library (e1071) 4) 서포트벡터머신 결과 - 서포트벡터머신 함수 : svm(y변수~x변수, data= _ - iris 데이터의 서포트벡터머신 결과 (전체 데이터를 사용한 결과) m1 2020. 3. 4. 10-4. 판별분석(Discriminant Analysis) 2 - 이차판별분석 - 10-4. 판별분석(Discriminant Analysis) 2 - 이차판별분석 - 4) 선형판별분석 vs 이차판별분석 5) 이차판별분석(QDA) - 모집단 등분산 검정 분산-공분산 행렬이 범주별로 다른 경우, 이차판별분석(QDA)을 실시 => Box's M-test 귀무가설 : 모집단의 분산-공분산 행렬이 동일 대립가설 : 모집단의 분산-공분산 행렬이 동일 X 등분산검정을 위한 패키지 : biotools install.packages("biotools") library(biotools) boxM(iris[1:4], iris$Species) [출력 결과] Box's M-test for Homogeneity of Covariance Matrices data: iris[1:4] Chi-Sq (approx.).. 2020. 3. 3. 10-3. 판별분석(Discriminant Analysis) 1 -선형판별분석- 10-3. 판별분석(Discriminant Analysis) 1 -선형판별분석- 1) 판별분석 · 판별분석(Discriminant Analysis) - 객체를 몇 개의 범주로 분류 - 범주들을 가장 잘 구분하는 변수 파악 및 범주간 차이를 가장 잘 표현하는 함수 도출 2) 예제 데이터 - Iris 데이터 train/test 분할 iris 2020. 3. 3. 관계형 데이터 모델링 (3) 7. 물리적 데이터 모델링 - 논리적 데이터 모델링이 관계형 데이터베이스 패러다임에 잘 맞는 이상적인 표를 만드는 것이었다면, 물리적 데이터 모델링은 선택한 데이터베이스 제품에 맞는 현실적인 고려는 하는 방법론 - 이 단계에서 가장 중요한 것은 성능입니다. 특히 역정규화(반정규화, denormalization)의 사례를 집중적으로 다룸 1) 물리적 데이터 모델링 - find slow query => 느려지는 지점 찾을 수 있음 -> 성능 향상 위한 방법 적용 - denormalization(역정규화, 반정규화) - index : 읽기 편하나 쓰기 어려움(연산 과정 -> 시간, 저장 공간 많이 듦) - application : 캐시 사용(입력에 따른 실행결과 저장 -> 데이터베이스 부하 감소) - 다양한 .. 2020. 3. 2. 이전 1 2 3 4 5 6 7 8 ··· 14 다음