RAG 아키텍처 설계 가이드 - 검색 품질부터 답변 생성까지
RAG 시스템을 만들 때 많이 놓치는 설계 포인트를 정리합니다. 문서 수집, 청킹, 임베딩, 벡터 검색, 리랭킹, 프롬프트 구성, 평가 방법까지 실제 서비스 개발 관점에서 설명합니다.
TestForge Team
RAG 시스템을 만들 때 많이 놓치는 설계 포인트를 정리합니다. 문서 수집, 청킹, 임베딩, 벡터 검색, 리랭킹, 프롬프트 구성, 평가 방법까지 실제 서비스 개발 관점에서 설명합니다.
RAG 품질의 출발점은 모델이 아니라 데이터입니다. 어떤 문서를 수집해야 하는지, HTML/PDF/위키 데이터를 어떻게 정제하고 메타데이터를 붙여야 하는지, 실무용 수집 파이프라인 관점에서 설명합니다.
RAG에서 청킹과 임베딩은 검색 품질의 핵심입니다. chunk 크기, overlap, 제목 보존, 코드 블록 처리, 임베딩 모델 선택과 인덱싱 전략까지 실무 기준으로 깊게 설명합니다.
RAG에서 검색 품질은 답변 품질을 거의 결정합니다. dense retrieval, BM25, hybrid search, query rewrite, metadata filtering, reranking을 어떻게 조합해야 하는지 단계별로 설명합니다.
검색이 끝났다고 RAG가 끝난 것은 아닙니다. 어떤 문서를 어떤 형식으로 LLM에 넣을지, 출처를 어떻게 표시할지, 모를 때는 어떻게 답하게 할지, 답변 생성 단계의 핵심 설계 포인트를 설명합니다.
RAG를 운영 단계로 올리려면 답변 품질을 어떻게 평가하고 어떤 로그를 남기며 어디서 병목이 나는지 봐야 합니다. retrieval 평가, groundedness, latency, feedback loop, 운영 체크리스트까지 정리합니다.