RAG(Retrieval-Augmented Generation) 파이프라인 모델링
RAG(Retrieval Augmented Generation) 모델링은 문서 기반의 질문 응답 시스템을 제공하여, 사용자의 질문에 대해 관련 문서를 찾아내고 이를 바탕으로 답변을 생성합니다. 그러나 이러한 시스템은 상업적 측면에서 비용, 환상(hallucinations), 규칙 적용, 그리고 캐싱과 같은 여러 문제점을 안고 있어, 이를 해결하기 위한 다양한 기술적 접근법과 개선 방안이 제시되고 있습니다. 특히, 스마트 캐시와 두 단계 응답 시스템은 비용을 줄이고 답변의 정확성을 높이며, 이는 고객 지원 또는 새로운 직원 온보딩과 같은 비즈니스 환경에서 특히 유용할 수 있습니다.