공부83 CH03 금융을 위한 대체 데이터: 범주와 사용 사례 금융을 위한 대체 데이터: 범주와 사용 사례¶ 대체 데이터 혁명¶ 빅데이터의 5V: 크기, 속도, 다양성, 정확성, 가치 새로운 데이터 소스의 사용 사례 대표적인 재화와 서비스 세트에 대한 온라인 가격 데이터로 인플레이션을 측정 매장 방문 횟수나 구매 횟수는 회사나 산업 고유의 판매나 경제 활동의 실시간 추정을 가능하게 함 인공위성 이미지는 이 정보가 다른 곳에서 이용되기 전에 수확량이나 광산, 석유 굴착장에서의 활동을 포착 전통적 투자를 포착하고자 새로운 기회를 창출 모멘텀: ML은 시장 가격 변동, 산업 심리, 경제 팩터에 대한 자산 노출을 식별 가치: 알고리듬은 회사의 본질 가치를 예측하기 위한 재무제표 이외에 많은 자산 노출을 식별 퀄리티: 통합 데이터의 정교한 분석을 통해 고객 평가 혹은 직원 .. 2023. 6. 17. CH02 시장 데이터와 기본 데이터: 소스와 기법 시장 데이터와 기본 데이터: 소스와 기법¶ 전통적 투자 전략 주로 공개된 데이터 의존 f(주식 기본 데이터, 기업의 공시된 재무 데이터, 산업 또는 매크로 데이터)=재무 모델 기술적 분석으로 주가와 거래량으로부터 계산된 지표를 사용해 시장 데이터에서 신호를 추출 현대 투자 전략 머신러닝 알고리듬은 인간이 정의한 규칙이나 경험보다 효율적으로 시장 데이터와 기본 데이터를 활용 3장의 대체 데이터와 결합할 때 더 효과적 2장의 선형 모델에서 순환 신경망(RNN) 등의 ML 알고리듬이 어떻게 시장과 기본 데이터 거래에 유용한 신호를 생성하는지 설명 2장의 목표 시장과 기본 데이터의 소스를 소개하고 이들이 만들어지는 환경(트레이딩 환경)을 어떻게 반영하는지 설명 시장 데이터의 적절한 해석과 전략의 설계와 실행 및.. 2023. 6. 17. CH01 트레이딩용 머신러닝: 아이디어에서 주문 집행까지 1부 데이터, 알파 팩터, 포트폴리오 1장. 트레이딩용 머신러닝: 아이디어에서 주문 집행까지 알고리듬 트레이딩 트레이딩 전략의 일부 요소나 모든 요소를 자동화하고자 알고리듬을 실행하는 컴퓨터 프로그램 알고리듬: 목표를 달성하고자 설계된 일련의 절차나 규칙 머신러닝 예측 오차 최소화 같은 목표를 달성하고자 데이터에서 규칙이나 패턴을 학습하는 알고리듬 액티브 투자 운용 투자자나 투자 관리자가 시장을 분석하고, 투자 기회를 발견하여 주식, 채권, 상품 등의 다양한 자산에 투자하는 전략액티브 투자 운용의 목표 평가에 사용된 벤치마크를 초과하는 포트폴리오 수익으로 정의되는 알파를 생성하는 것 벤치마크: 주식 시장 지수 등 알파: 투자자가 투자 전략과 의사 결정을 통해 얻는 추가적인 수익(=초과 수익) 적극적 관리.. 2023. 6. 6. 16-3. 웹문서 텍스트마이닝 - 한글 웹문서의 자연어 처리와 정보 추출 - 16-3. 웹문서 텍스트마이닝 - 한글 웹문서의 자연어 처리와 정보 추출 - 1) 텍스트 마이닝 - 텍스트 마이닝(text mining)이란, 다양한 알고리즘을 이용하여 대용량의 텍스트 문서로부터 트렌드와 관심어를 찾아내는 기법이다. 2) 자연어 처리 - 자연어 처리(Natural Language Processing)란, 컴퓨터로 사람 언어를 분석, 이해, 생성하는 기술을 일컫는다. - 품사 분석 : SimplePos09() - str_match()를 이용한 N(체언), P(용언) 추출 3) 워드 클라우드 - 워드 클라우드(word cloud)는 텍스트의 키워드, 개념을 직관적으로 파악하도록 핵심 단어를 시작적으로 보여주는 기법이다. 4) 웹문서의 텍스트마이닝 실습 (1) '네이버 영화'에서 영화 의 네.. 2020. 3. 6. 16-2. Convolutional Neural Network 16-2. Convolutional Neural Network 1) Features - 신경망 모델(Neural Net)은 입력값으로 객체의 특성(feature)을 받고, - 출력된 값과 실제 값을 비교하는 과정을 거침 (지도학습; Supervised Learning) - 하나의 이미지는 수많은 픽셀들이 모여 형성하고 있으며, 특정 색에 해당하는 특정 값을 가짐 - 따라서, 이미지의 모든 픽셀값들을 입력값으로 갖는 신경망 모델을 만들 수 있음 2) Intuitions - 하지만, 고해상도 이미지의 경우 특성feature의 수가 너무 많아지므로 - 모든 뉴런들이 모든 픽셀들과 모두 연결되어 있을 경우 (fully connected) 모델 학습에 큰 어려움이 있음 - 따라서, 각 뉴런들이 이미지의 일부의 특.. 2020. 3. 6. 16-1. 딥러닝과 텍스트 마이닝-Neural Network 16. 딥러닝과 텍스트 마이닝 16-1. Neural Network 1) Concepts - 인공신경망은 기계학습(Machine Learning)의 통계적 학습 알고리즘 중 하나 - 컴퓨터 비전, 자연어 처리, 음성 인식 등의 영역에서 활발하게 사용됨 - 신경망 모델은 (Neural Network)은 Percoptron을 한 단위로 하는 네트워크를 구축하여, 인간의 신경세포(Neuron)과 유사한 기능을 하도록 제안되었음 2) Perceptron - Single Layer - 하나의 Percoptron은 단순하게 다수의 입력과 가중치의 선형 결합을 계산하는 역할을 수행 - Activation 함수에 따라 선형결합으로 생성되는 출력의 값이 결정됨 3) Multi-layer perceptron - Perce.. 2020. 3. 6. 이전 1 2 3 4 5 ··· 14 다음