DBMS/AgensSQL

검색 증강 생성(RAG)과 데이터베이스 기반 생성형 AI에 대한 이해

(주)비트나인 2024. 4. 22. 09:39

생성형 AI

 

생성형 AI 활용의 한계점

최근 몇 년 간 ChatGPT, Bard, LLaMA 등 거대 언어 모델(Large Language Models, LLM) 기반 생성형 AI가 대중화되었고, 많은 기업들은 생성형 AI를 비즈니스에 도입하여 생산성을 높이려는 시도를 하고 있습니다. 생성형 AI는 일반적으로 방대한 데이터로 사전 학습(pre-training)된 LLM 모델을 기반으로 제공되며, 일반적인 작업에서는 잘 작동합니다. 

 

하지만, 특정 산업군의 전문 지식이나 별도의 데이터가 필요한 작업의 경우 기본 모델만으로는 성능의 한계가 존재합니다. 특히, 일반적인 생성형 AI 모델은 생성 결과의 출처를 알 수 없어 거짓 정보를 사실인 정보처럼 출력하는 환각 현상(hallucination)을 구분하기 어렵습니다.

 

이를 해결하기 위해 모델에 체계화된 지시문을 제공하는 프롬프트 엔지니어링(prompt engineering)을 수행하거나, 모델 매개변수를 직접 조정하는 미세조정(fine-tuning)을 수행할 수 있지만 각각 개선할 수 있는 성능의 한계 또는 높은 비용과 같은 문제가 존재합니다. 이렇게, 생성형 AI를 활용하는 데 있어 발생할 수 있는 한계점들을 요약해 보면 다음 그림과 같습니다.

 

생성형 AI 한계
<그림 1. 생성형 AI 활용의 한계점들.>

 

검색 증강 생성(RAG)

검색 증강 생성(Retrieval-Augmented Generation, RAG)은 이러한 생성형 AI 활용에 있어 발생하는 한계를 극복하기 위한 방법 중 하나로, 정보 검색 모델과 생성 모델을 결합하여 생성 결과의 품질을 향상시킬 수 있습니다. RAG 시스템은 사용자 데이터를 사전에 변환하여 외부 저장소에 저장하고, 쿼리 입력 시 쿼리와 유사한 데이터를 저장소에서 검색하여 생성에 이용합니다. 

 

RAG 시스템은 모델 추가 학습 과정을 거치지 않고, 검색 시스템만 추가하면 되므로 비용 효율적으로 생성 모델에 사용자 데이터를 반영할 수 있습니다. 또한, 변환된 데이터는 원 데이터와 함께 인덱싱되어 저장됩니다. 따라서, 생성 결과에 어떤 데이터를 참조하여 생성되었는지 알 수 있고 이는 모델이 생성한 답변의 환각 여부를 판단하는 데 중요한 역할을 합니다.

 

RAG 구조
<그림 2. RAG 시스템의 구조.>

 

RAG에 이용되는 데이터베이스

그렇다면, RAG 프레임워크에는 어떤 형태의 외부 저장소가 이용될까요? AI 모델은 일반적으로 비정형인 데이터를 모델이 분류하기 쉬운 형태인 벡터(vector)로 변환하여 추론에 사용합니다. 이러한 특성 때문에, 현재 많은 RAG 프레임워크는 벡터 데이터 저장 및 검색에 특화된 벡터 DB를 외부 저장소로 사용하고 있습니다.

 

하지만, RAG 프레임워크에는 벡터 DB 외에도 다양한 형태의 저장소를 이용할 수 있습니다. 관계형 DB를 이용한 전문(full-text) 검색으로 더 정확한 검색 결과를 활용할 수도 있으며, 그래프 DB를 이용하여 데이터 간 연결 정보를 검색에 활용할 수도 있습니다.

 

예를 들어, 그래프 DB에 지식 그래프(knowledge graph) 정보를 적재하여 다음과 같이 그래프 RAG를 구축할 수 있습니다.

 

GraphRAG
<그림 3. 그래프 RAG 시스템의 구조.>

 

결론

본 포스트에서는, 생성형 AI를 기업 수준에서 활용할 때에 어떠한 한계점이 존재하고 RAG 시스템이 어떻게 이러한 한계를 극복할 수 있는지 알아보았습니다. RAG 시스템은 생성형 AI 의 효과적인 활용을 가능하게 하고, RAG  관련 서비스와 솔루션에 대한 관심이 높아지고 있습니다. 다음 포스트에서는, 비트나인에서 새롭게 출시하는 AgensSQL Gen AI Edition에서의 RAG 시스템 구축 방법 및 다른 RAG 프레임워크와 차별화되는 부분은 무엇인지 살펴보겠습니다.

 


비트나인의 생성형 AI 솔루션, AgensSQL GenAI Edition에 대해 궁금하시다면?

▶제품 소개서 보기

 

비트나인의 콘텐츠를 계속 받아보고 싶으시다면?

▶뉴스레터 구독하기

 

제품 및 기술문의

070-4800-3517  |   agens@bitnine.net