728x90
반응형

쿼리엔진 2

[Day 10] LLM & RAG 실전 챌린지 - 고급 RAG

7.1 개발 환경 구축하기​7.2 리랭킹LLM 기반 리랭킹은 대규모 언어 모델(LLM)을 활용해 초기 검색 결과를 다시 평가하고, 사용자의 질문과 가장 관련성이 높은 순서로 결과를 정렬하는 방법LLM 은 초기 검색 결과를 전체적으로 검토함LLM이 새롭게 계산한 점수를 기준으로, 기존 임베딩 모델의 겸색 결과를 다시 정렬함​​[ 기본 RAG ]벡터 검색으로 상위 4개 문서를 찾아옴LLM 호출 1회 : 검색된 4개 문서 전체를 바탕으로 답변을 생성총 LLM 호출 : 1회​[ 리랭킹 적용 RAG ]벡터 검색으로 상위 4개 문서를 찾아옴LLM 호출 4회 : 각 문서와 질문의 관련성을 1-10점 사이로 평가함LLM 호출 1회 : 관련성 점수가 높은 상위 2개 문서를 이용해 답변을 생성총 LLM 호출 : 5회​​7..

카테고리 없음 2025.09.08

[Day 3] LLM & RAG 실전 챌린지 - 인덱싱, 저장하기, 쿼리

2.4 인덱싱 1) 인덱싱이란?문서 객체로 구성된 특정 형태의 데이터 구조​2) 벡터 저장소 인덱스라마인덱스에서 가장 널리 사용되는 인덱스 유형문서를 노드 단위로 분할한 뒤, 각 노드의 텍스트를 벡터화 하여 LLM이 쿼리를 보다 효율적으로 처리할 수 있도록 준비​* 벡터 임베딩 : 텍스트의 의미를 수치화하여 벡터로 표현하는 기술, 의미적으로 유사한 단어나 문장은 임베딩 공간에서 물리적으로 가까운 위치에 맵핑된다.장점 : 효율적인 검색, 의미론적 검색, 다양한 쿼리 전략 지원​3) Top-K 검색벡터 저장소 인덱스를 활용하여 쿼리를 수행하고 의미적으로 가장 유사한 상위 K개의 임베딩 결과를 반환하는 검색 방식​​2.5 저장하기문서를 인덱싱 하면 쿼리를 실행할 준비가 완료되지만 모든 텍스트에 대해 임베딩을 ..

프로그래밍/LLM 2025.09.07
728x90
반응형