IT22 [생성형AI][RAG] 증상 기반 법정감염병 판별 챗봇 😷 증상 기반 법정감염병 판별 챗봇 (RAG, LLaMA2)¶ 목표: RAG와 LLaMA2를 활용한 법정감염병을 판별하는 챗봇을 개발합니다. LLM의 환각과 해결 방안 LLM의 가장 일반적인 문제는 부정확하거나 환각적인 반응을 보인다는 것입니다. LLM의 가중치에 포함된 일반 지식과 최신 정보 간의 불일치는 RAG를 사용하여 해결될 수 있습니다. RAG(Retrieval-Augmented Generation, 검색 증강 생성) RAG에는 외부 지식 소스의 추가 정보를 제공하여 LLM(대형 언어 모델)의 출력을 향상시키는 작업이 포함됩니다. Langchain RAG 문서 내RAG 프로세스 참고 1. 환경 설정 및 데이터 로드¶ 1-1. 필수 라이브러리 설치¶ In [ ]: !pip install trans.. 2024. 2. 9. [시각화] MZ세대의 문해력은 정말로 낮을까? - 성인문해능력조사 분석 [시각화] MZ 세대의 문해력은 정말로 낮을까?¶ 1. 분석 배경¶ '심심한 사과' 올렸더니 "난 안심심해"…문해력 논란 부른 사과문 "금일이 금요일? 사흘이 4일?" 읽을 줄 알아도 이해 못하는 디지털 세대 “시장이 반찬” 미주, ‘속담 상식 논란’에...누리꾼 “나도 몰라” VS “기본이다” 🤔 과연 MZ 세대의 문해력은 정말로 낮을까? 2. 데이터 분석¶ KOSIS(https://kosis.kr/) 의 성인문해능력조사 성인이 일상생활에서 필요한 문해능력 수준 측정 문해 수준을 총 4단계(수준 1 ~ 수준 4)로 나누어 판별 수준1(초등 1~2학년 학습 필요 수준) 일상생활에 필요한 기본적인 읽기, 쓰기, 셈하기가 불가능한 수준 수준2(초등 3~6학년 학습 필요 수준) 기본적인 읽기, 쓰기, 셈하기는.. 2024. 2. 7. [생성형AI][LLM] 데이터 없이 생성형 AI를 활용하여 개체명인식(NER) 분류 - 금융 도메인 데이터 없이 생성형 AI를 활용하여 개체명인식(NER) 분류 - 금융 도메인¶ 토큰 분류는 문장의 개별 토큰에 레이블을 할당합니다. 가장 일반적인 토큰 분류 작업 중 하나는 개체명 인식(Named Entity Recognition, NER)입니다. 개체명 인식은 문장에서 사람, 위치 또는 조직과 같은 각 개체의 레이블을 찾으려고 시도합니다. GPT-3로 생성된 금융 NER 데이터 세트에서 klue/roberta-small를 파인 튜닝하여 새로운 개체를 탐지합니다. 추론을 위해 파인 튜닝 모델을 사용합니다. In [ ]: from huggingface_hub import notebook_login notebook_login() VBox(children=(HTML(value=' 2024. 2. 7. [언어모델 변천사 A to Z] RNN부터 GPT까지 가볍게 살펴보기 [언어모델 변천사 A to Z] RNN부터 GPT까지 가볍게 살펴보기 - 모델별로 간단한 특징과 그림으로 정리했습니다. 1. RNN(Recurrent Neural Network, 1986) Paper: Learning representations by back-propagating errors 시퀀스 데이터를 처리하기 위해 개발된 모델 입력과 출력을 시퀀스 단위로 처리하여, 이전 시퀀스의 정보를 현재 시퀀스에 전달하는 구조 하지만 긴 시퀀스에 대해 정보를 전달하는 데 어려움이 있어, 장기 의존성 문제(long-term dependency problem)를 가지고 있음 2. LSTM(Long Short-Term Memory, 1997) Paper: LONG SHORT-TERM MEMORY(LSTM) RNN.. 2023. 3. 25. 이전 1 2 3 4 다음