패스트캠퍼스 환급챌린지 10일차 : RAG

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

*_1. 학습 인증샷 4장 이상 포함
*_① 오늘자 날짜, 공부 시작 시각 포함 사진 1장

② 오늘자 날짜, 공부 종료 시각 포함 사진 1장

③ 1개 클립 수강 인증 사진 (강의장 목록 캡쳐, 강의 내용이 담긴 수강화면이 보이지 않도록) 1장

④ 학습 인증샷 1장 이상 (ex. 필기 촬영, 작업물, 등)

2. 학습 후기 700자 이상 (공백 제외)

임베딩

임베딩 모델

임베딩을 하는 이유

벡터의 유사도

RAG

벡터 데이터베이스

밀버스는 은근 장애가 많다
수천, 수억 단위의 문서를 백업, 재배치, 재저장을 빈번하게 하는 상황에서는 Qdrant가 가장 안정적, 10만에서 1000만 이내의 문서라면 Qdrant 추천
Chroma와 Pinecone은 튜토리얼 용으로 많이 사용됨
프로덕션에서는 FAISS가 많이 사용됨. 수억~수십억이라면 FAISS 추천

청킹 (Chunking)

길이 단위 Chunking

시맨틱 Chunking

문맥을 읽고 적절한 단위로 직접자르는 경우
사람이 하는 경우도 있지만, AI를 사용하기도 함
예를 들어, LLM이 하는 경우, 문맥이 끊기는 구간을 LLM이 판단하여 잘라주는 경우에 해당되며, LLM 사용 비용이 발생하지만, 길이 단위로 자르는 경우에 비해서 검색 성능에서 유리함

LLM Based Chunker

Fine-tuned Model Based Chunker

NLP엔지니어라면 BERT, T5, 소형 LLM같은 모델로부터 이어지는 두 개의 문장 내지 문단을 주고 이어지는 문장, 이어지지 않는 문장인지 판단하도록 학습한 후, 일종의 임계값으로 조절하면 꽤 뛰어난 Chunker로 동작함 (BERT의 Next Sentence Prediction의 고도화)
Langchain의 임베딩을 이용한 Semantic Chunker보다 훨씬 잘 동작

합성 데이터 생성 방식

패스트캠퍼스 환급챌린지 12일차 : 거대 언어 모델의 답변 (0)	2025.04.12
패스트캠퍼스 환급챌린지 11일차 : 임베딩 (0)	2025.04.11
패스트캠퍼스 환급챌린지 9일차 : 파인튜닝 (0)	2025.04.09
패스트캠퍼스 환급챌린지 8일차 : 허깅페이스, 토크나이저와 템플릿 (0)	2025.04.08
패스트캠퍼스 환급챌린지 7일차 : ChatGPT API를 이용한 데이터 생성 (0)	2025.04.07

Inderight Investments