ARCHIVES

[알쓸IT잡] 그래프 데이터베이스(Graph Database)의 장점 - Part. 2

(주)비트나인 2020. 7. 1. 16:13

알쓸IT잡

함께 만들어 나가는 IT 용어사전, 알쓸IT잡!
IT 분야의 모든 궁금증을 해결해 드립니다.

오직 알쓸IT잡에서만!

[알쓸IT잡] 그래프 데이터베이스의 장점! (Graph Database)

 

 

지난 글에 소개했던 그래프 데이터베이스의 개념에 이어서 이번에는 그래프 DB의 잘 알려진 장점에 대해서 소개해드리겠습니다.

그래프 DB가 자랑하는 핵심적인 장점 3가지는 다음과 같습니다.

 

1. 스키마 없는 구조

2. 질의 처리 속도

3. 직관적인 모델링

1. 스키마가 없는 구조 (Schema-less)

그래프 데이터베이스는 개별 데이터를 정형화된 형태의 테이블에 삽입하는 방식이 아닌 하나의 객체로 저장하기 때문에 데이터 용량이 늘어나거나 입력되는 형태가 다양해도 문제가 되지 않습니다. 

 

그래프 DB는 단일 서버 환경 및 분산 데이터 환경에서 뛰어난 운용성을 자랑합니다. 전체 테이블 데이터를 확인하여 동일하고 추가적인 작업 없이 간단하게 데이터 객체 간의 선을 연결해주면서 데이터 관계를 나타낼 수 있습니다. 이러한 특징으로 그래프 DB 사용자는 데이터 운영의 유연성을 확보할 수 있습니다.

 

아래 그림과 같이 데이터베이스에 새로운 속성을 가진 값을 추가하고자 할 때 관계형 DB에서는 칼럼을 추가하고, 외래키(Foreign Key)를 연동하면서 테이블을 확인하여 대상 테이블에 대한 칼럼 및 제약 조건(Constraint) 추가 작업 등 복잡한 단계를 거쳐야 합니다.

 

 

관계형과 그래프 데이터 속성 추가 방식의 차이

이러한 작업은 전체 DB 설계에 대한 이해도가 없으면 모델 비정규화 문제, 데이터 정합성 문제, 테이블 내 불필요한 null 값 생성, 애플리케이션 수정 등과 같은 문제들을 일으킬 수 있습니다. 

 

이와는 반대로 그래프 DB는 새로운 속성값을 가진 노드가 추가될 수 있고, 새롭게 입력된 데이터를 다른 데이터와 연결해주는 것만으로도 작업을 끝낼 수 있으며, 이러한 노드들에는 단독 또는 다중 레이블이 적용될 수 있어 관리가 편리합니다. 

2.질의 처리 속도

관계형 DB는 별도의 테이블에 저장된 데이터의 관계를 나타내기 위해서 조인(join)방식을 사용합니다. 반면, 그래프 DB는 직접적으로 데이터 간의 관계를 생성하고, 생성된 데이터 간의 관계를 횡단하며 필요한 데이터를 조회하는 방식을 사용합니다.

 

이러한 차이점 때문에 개별 테이블 데이터에 대한 검색이 필요하고 조인이 늘어날수록 부담이 증가하는 관계형 DB 모델과 달리 그래프 DB 모델은 빠르고 효율적으로 원하는 데이터를 질의할 수 있습니다. 

 

아래 그림과 같이 특정 인물의 친구의 친구를 찾는 것처럼 복잡한 관계 중심의질의를 하고, 깊이 값이 증가할 때,  두 DB 속도의 차이가 뚜렷이 나타납니다. 

 

특정 인물의 친구 관계를 질의할 때 데이터 조회 방식의 차이

여러 테이블에 대한 연속적인 조인 수행 시, 관계형 DB는 모든 테이블 데이터에 대한 검색을 수행합니다. 조회하는 데이터양이 증가할수록 질의 속도 성능은 저하됩니다. 하지만 그래프 DB는 시작점을 찾기 위한 레이블 검색 작업 수행 후, 각 데이터 간의 관계를 따라 조회하여 부담 없는 처리가 가능합니다. 관계 중심의 데이터 구조는 조회하고자 하는 데이터양이 복잡하게 증가하더라도 신속하게 사용자가 원하는 결과를 도출할 수 있습니다. 

3.직관적인 모델링

각각의 데이터 객체와 이를 연결하는 선물로 이루어진 그래프 DB는 사용자에게 현실 모형에 가까운 직관적인 데이터 형태를 제공합니다. 관계형 DB의 경우, 현실 모형을 테이블 형태에 맞추는 과정을 통해 데이터의 직관성을 떨어뜨립니다. 

이와 같은 데이터 모델의 변형은 두 가지 문제가 야기되는데, 첫 번째는 개발 과정 중 비효율적인 업무를 증가시키고, 시스템의 DB 구조를 이해하기 어렵게 만듭니다. 

 

두 번째는 CEO 혹은 의사결정권자와 관련 부서 실무자가 데이터 활용이 어렵다는 점입니다. 

아래 그림에서 보이듯이 그래프 DB 모형은 현실을 반영한 직관적인 모습을 제공하며, 조직의 데이터 활용 영역을 과거 전문 기술자들이 다루기 쉽도록 바꿀 수 있는 가능성을 제시합니다. 

 

현실을 반영한 데이터 구조

 

애자일 개발 방법론(Agile Development Model)으로 지속적인 개발과 테스트를 통해 반복적인 개발의 과정을 거칩니다. 이러한 개발 과정은 진행 중 변화하는 시스템 환경에 맞추어 지속적인 DB 설계 수정 작업과 모든 프로젝트 참여자가 이해할 수 있는 데이터 모델을 요구하게 됩니다.

 

첫째로 관계형 DB의 개발 과정에서 불필요한 업무가 늘어나며, 프로젝트에 참여하는 인력들이 추가로 시스템의 DB 구조를 이해해야 하는 부가적인 활동이 발생하게 됩니다. 두 번째로, 점점 복잡해지는 데이터 모델로 인해 DB의 유연성이 점차 떨어지게 되고 데이터를 실제 활용하는 주체들인 비전문가들이 데이터를 활용하기 힘들어지게 됩니다. 결국 관계형 데이터 모델은 프로젝트 참여자들을 이해시키기 어렵게 만들어 전체 프로젝트의 시간 지연과 품질 저하 등의 문제를 일으킬 수 있습니다.  

 

그에 반해 그래프 DB의 직관적인 모델링은 시스템 개발 시점과 데이터 운영 시점에 모두 장점으로 작용합니다. 직관적인 모델링을 통해 빠른 개발, 테스트 및 시스템 수정이 가능해지며, 앞서 언급한 문제점들을 최소화할 수 있습니다. 

의사결정을 돕는 그래프 데이터베이스

그래프 DB가 가트너 2020년 상위 전략적인 기술 트렌드의 핵심 기술 중 하나인 인식적 증강 (Cognitive Augmentation)투명성(Transparency)에 어떤 연관점이 있는지 궁금하시다면 다음 적용 사례를 확인해보세요! 

 

 

이상거래탐지시스템(FDS) 고도화의 필수요소 그래프DB 도입

이상거래탐지시스템(FDS)이란? 개요 및 정의 인공지능 기술을 논의하면서 떠오르는 키워드 중 하나는 이상거래탐지시스템, FDS(Fraud Detection System)입니다. FDS의 첫 단어 Fraud의 사전적 의미는 다음��

bitnine.tistory.com

 

 

의료용 AI, 그래프 데이터베이스 도입으로 AI의 대장암 진단 데이터 신뢰 근거를 마련하다

그래프 데이터베이스(Graph Database) 기반의 대장암 진료용 의사결정 지원 도구 개발 전 세계 인구의 사망원인 2위는 암으로, 2018년에만 대장암으로 86만 명이 사망했습니다. 암 연구와 치료가 꾸준�

bitnine.tistory.com

 

 

지식 그래프를 도입한 XAI 신약개발 솔루션

2012년 화이자의 비아그라 특허가 만료되자마자 70여 가지의 국내 제네릭 의약품 (복제품)이 쏟아져나와 연간 1000억 원 가량 되는 발기부전치료제 시장에서 출혈경쟁으로 인해 상당수 업체가 비��

bitnine.tistory.com