GRAPH DB

그래프 데이터베이스: 장점과 활용 사례

(주)비트나인 2022. 7. 28. 08:30

 

 

그래프 데이터베이스란?

그래프 데이터베이스는 정향 데이터 위주의 처리만 가능한 관계형 데이터베이스 보완하기 위해 등장한 NoSQL 계열의 데이터베이스입니다.

 

 

그래프 데이터베이스를 이해하기 위해서는 그래프 데이터에 대한 이해가 필요합니다. 그래프 데이터는 수학적 그래프 이론에 토대를 두고 있는데, 개별 객체의 데이터를 나타내는 점(Node 혹은 Vertex), 성질이 비슷한 객체들을 묶어주는 묶음(Label), 객체들 간의 관계를 표시하는 관계선(Edge 혹은 Relationship)으로 이루어져 있습니다.

 

그래프 데이터베이스는 이러한 그래프 데이터를 실시간 처리 환경에서 본연의 모습을 유지하며 저장, 운영, 처리와 같은 최선의 데이터 운영 환경을 마련하기 위한 기술을 구현하는 솔루션입니다.

 

그래프 데이터베이스는 기본적으로 그래프 데이터를 저장하기 위한 저장소 (Graph Storage), 그래프 데이터를 처리하기 위한 그래프 프로세싱 엔진 (Graph Processing Engine)과 그래프 데이터를 효율적으로 저장하고 처리하기 위해 지원되는 언어(Graph Query Language)로 이루어져 있습니다. 데이터를 점과 선의 그래프 형태로 저장하고, 선을 따라 특정 패턴과 이상 현상을 빠르게 추적할 수 있으며, 추가적인 도구로 이를 시각화함으로써 데이터의 상관관계를 보다 직관적으로 빠르게 분석할 수 있습니다.

 

 

그래프 데이터베이스의 장점

#1 : 스키마리스 (Schema-less)

스키마 vs 스키마리스

 

스키마리스란 데이터 모델에서 모든 키와 값의 데이터 타입을 정의해 둔 스키마를 변경하지 않고도 필요할 때 값을 변경할 수 있음을 의미합니다. 데이터를 자주 추가하거나 삭제해야 하는 변경이 잦은 경우에는 그래프 DB의 스키마리스로 뛰어난 유용성을 자랑합니다. 특정 시점에서 분석의 깊이를 이해하기 위해 속성을 추가할 경우, 또는 속성 유형이 엄격하게 정의되지 않은 경우에 사용하기 적합합니다.

 

테이블 데이터에 새로운 속성을 가진 값을 추가하고자 할 때 관계형 데이터베이스에서는 칼럼 추가, 외래 키 연동, 대상 테이블에 대한 칼럼 및 제약 조건 추가 작업 등 복잡한 단계를 거쳐야 하는 반면, 그래프 DB는 새로운 속성 값을 가진 노드를 추가해 주고, 새롭게 입력된 데이터를 다른 데이터들과 선으로 연결해 주는 것만으로 작업을 끝낼 수 있습니다.

 

이러한 특징으로 그래프 DB 사용자는 데이터 운영의 유연성을 확보할 수 있습니다.

 

 

#2 : 질의 실행 속도 (Query Processing Speed)

 
단순하고 빠른 그래프 DB의 질의 속도

 

기존 관계형 데이터베이스는 별도의 테이블에 저장된 데이터의 관계를 나타내기 위해 조인(join) 방식을 사용하는 반면, 그래프 DB는 직접적으로 데이터 간의 관계를 생성하고, 생성된 데이터 간의 관계를 횡단하며 필요한 데이터를 조회합니다.

 

테이블의 조인 방식은 데이터가 증가할수록 성능이 저하될 수밖에 없지만, 그래프 DB는 시작점을 찾기 위한 레이블 검색 작업 수행 후 각 데이터 간의 관계들을 따라 조회하여 부담 없는 처리가 가능합니다. 관계 중심의 데이터 구조는 조회하고자 하는 데이터양이 복잡하더라도 신속하게 사용자가 원하는 결과를 도출할 수 있습니다.

 

 

#3 : 직관적인 모델링 (Intuitive Modeling)

직관적인 모델링

관계형 DB에서는 현실을 반영한 모델을 테이블 형태로 맞추는 과정을 통해 데이터 모델의 직관성을 떨어뜨린다. 이와 같은 데이터 모델은 개발 과정 중 불필요한 업무를 증가시키고, 전체 프로젝트 참여 인력들이 시스템의 데이터베이스 구조를 이해하기 어렵게 만듭니다.

 

각각의 데이터 객체와 이를 연결하는 선들로 이루어진 그래프 DB는 사용자들에게 현실 모델에 가까운 직관적인 형태의 데이터 모델을 제공합니다. 조직의 데이터 활용 영역을 과거 전문 기술자들이 다루기 쉬운 영역으로 변경할 수 있는 가능성을 제시합니다.

 

그래프 DB의 직관적인 모델링은 시스템 개발 시점과 데이터 운영 시점에 모두 장점으로 작용됩니다. 직관적인 그래프 모델링을 통해 빠르게 개발, 테스트 및 수정을 할 수 있습니다.

 

 

그래프 데이터베이스 분석

그래프 분석이란 기존 테이블 형태의 데이터 집합에 대한 분석이 아닌, 노드와 엣지 형태로 구성된 그래프 데이터를 분석하는 행위를 의미합니다. 그래프 분석을 통합 데이터의 분석에 적용 시, 기존 통계 분석으로는 판단할 수 없었던 새로운 관점의 분석 서비스에 접근할 수 있습니다.

 

 

그래프 알고리즘 (Graph Clustering)

 

우측의 그림에는 수많은 알고리즘 중 하나인 그래프 군집 (Graph Clustering) 알고리즘을 보여주고 있습니다. 이는 연관성이 높은 노드/엣지들을 같은 집단(community)으로 묶는 알고리즘입니다.

 

사용자는 복잡한 머신러닝 기술을 적용하지 않아도 군집화 및 중심성 등의 그래프 알고리즘을 구현하여 데이터 분석을 실현할 수 있습니다. 비즈니스 통찰력을 얻기 위해 그래프 알고리즘으로 그래프 데이터의 패턴, 경로, 군집 및 유사도를 쉽게 식별하고, AI/ML 애플리케이션과 응용하여 분석의 질을 높일 수 있습니다.

 

대표적인 알고리즘은 다음과 같습니다.

 

그래프 유사도 (Graph Similarity)
그래프 중심성 (Graph Centrality)
유사도란 두 그래프 간의 구조 또는 이웃의 속성이 얼마나 비슷한지를 측정합니다.
특정한 기준에 따라 정량적으로 순서를 매깁니다. 데이터들 간의 상대적 중요성을 측정하기 위함입니다.
커뮤니티 탐지 (Community Detection)
중심-주변 구조 (Core Peripheral Structure)
연결선 밀도에 따라 그룹을 분할하는 기법입니다. 군집 기법을 적용하여 비슷한 속성을 가진 분류체계를 만듭니다.
연결선의 밀도에 따라 중심부와 주변부로 분할하는 기법입니다. 분류 기준이 존재하지 않는 데이터에서 데이터 패턴 기반으로 분류하고자 하는 경우에 사용됩니다.

 

그래프 데이터베이스의 활용 사례

지식 그래프 기반 인력 매칭 시스템 (한국개발연구원)

 
그래프 DB로 구현한 지식 그래프 기반 인력 매칭 시스템

어느 기업·기관이든 양적 성장에 따른 다양한 정보(예: 수요, 프로젝트, 평가, 성과)를 축적한 통합 관리 시스템을 가지고 있기 마련입니다. 기존 통합 관리 시스템만으로는 정보 간 연계성이 부족하여 사업 기획·발굴에 어려움이 있지만, 그래프 DB를 도입한다면 다양한 DB 등 통합·확장이 어려운 RDB 기반 시스템의 개선으로 검색, 맞춤형 매칭, 신규 사업 기획 등 생산적인 환경을 구현할 수 있습니다.

 

비트나인은 한 연구기관의 나날이 증가하는 데이터를 효율적이고 효과적으로 관리할 수 있도록 그래프 DB로 고도화된 지식 관리 시스템을 구축했습니다. 최적의 그래프 쿼리 언어, 시각화 도구, 그래프 알고리즘으로 강화된 지식 그래프는 데이터의 가치를 높이고 추천 시스템을 한 단계 발전시킬 수 있었습니다. 수년간 해외 협력국을 대상으로 우리나라의 경제발전경험 공유사업을 수행해오며 축적한 다양한 정보 간의 연계성을 직관적으로 확인할 수 있는 지식 그래프 기반의 인력 매칭 시스템으로 체계를 다졌습니다.

 

 

그래프 DB로 구축한 인력 매칭 시스템

그래프 DB 특징 소개 그래프 데이터베이스는 데이터 수집, 모델링, 분석, 신규 데이터 입력, 연결 관계 처리 영역에서 많은 장점이 있다. 일반적으로 Excel과 같은 집합 데이터를 처리하는 정형화

bitnine.tistory.com

 

 

제조 데이터 이력 관리 시스템 (DSME INC)

상선 하나를 제조하는데 관련 부품 또는 하청 업체들에 대한 정보가 자주 업데이트됩니다. 수많은 데이터를 관계형 DB인 오라클에 저장했지만, 이를 활용해 빠르고 정확한 이력 관리 및 검색 플랫폼을 구축하기 위해 비트나인의 아젠스그래프를 선택했습니다.

 

 
그래프 DB로 여러 데이터를 통합 연결한 모델링

 

그래프 DB는 데이터 간의 연관관계를 물리적으로 맺어주는 것과 논리적으로 서비스를 서로 연결시켜주는 용도로 사용했습니다. 선박 모델링부터 시작해서 자재 납품 및 생산까지 여러 단계의 전문 애플리케이션이 사용되는데, 이 전문 애플리케이션들의 키 데이터를 엮어서 디지털 스레드(Digital Thread)를 구현할 수 있었습니다. 디지털 스레드를 잘 연결하고 활용한다면 각 단계에서 생성되는 데이터를 활용하여 효율적인 의사결정을 내릴 수 있기 때문에 다양한 정형 및 반정형 데이터를 가지고 그래프 DB로 통합 관리하였습니다.

 

새로운 플랫폼은 데이터 간의 관계 영향도 분석이 편리해졌고, 다양한 단계별 서비스에 따른 변경 이력 추적이 가능해져, 제조 데이터에 대한 이력 관리가 효율적인 시스템으로 거듭났습니다.

 

 

AgensGraph Use Case: 제조 데이터 이력관리 시스템 구축

RDB와 GDB의 장점을 함께 구현한 사례 Background 글로벌 유명 저널인 포브스(Forbes)와 세계 최고 연구 기관인 가트너(Gartner)는 AI 기술을 효율적으로 실현하기 위한 핵심기술로 그래프 기술(Graph Technolo

bitnine.tistory.com

 

AI 금융사기방지 플랫폼 (KB 국민은행)

 
대포통장 그래프 모델링

AI 금융사기방지 플랫폼에 그래프 DB 모델 및 분석 기법으로 대포통장 적발 정확도를 확보하고 고객의 정보를 보호할 수 있는 시스템으로 향상시킨 사례가 있습니다.

 

AI금융사기방지 플랫폼에는 여러 서버가 있는데 학습 서버, 시뮬레이션 서버, 그리고 AI 추론 서버를 거친 탐지 결과를 가지고 그래프 DB로 분석해 보는 식의 시스템입니다.

 

예를 들어 대포통장으로 의심되는 계좌가 있다면 계좌-대표자-주소 등의 연결된 정보를 모델 생성해서 관계 분석을 하면 연결 형태가 보이면서 대포통장으로 추정되는 노드를 적발합니다.

 

 

실제 그래프 DB를 도입한 AI 금융사기방지 플랫폼 운영 결과, 대포통장 발생건수가 기존 시스템으로 운영한 기간 대비 약 42% 줄어드는 효과를 나타냈습니다.

그래프 데이터베이스의 미래

그래프 DB는 기존의 데이터 관리 시스템으로는 보이지 않았던 문제들의 핵심 원인을 한눈에 발견하여 기업의 자원과 비용을 절감할 수 있고, 새로운 마케팅 기회 발굴 등 비즈니스 개선에 효과적으로 활용할 수 있습니다.

 

글로벌 유명 연구 기관들도 그래프 기술에 대해 기술적 미래 가치를 인정하고 있습니다. 가트너는 2019년부터 3년 연속으로 데이터 분석 트렌드의 핵심 기술 중 그래프 기술을 언급하고 있을 정도입니다. 많은 기술 분석가들이 향후 10년 동안 그래프 활용이 매년 성장할 것을 예상하며 그래프 기술이 입증된 것은 잘 알려진 사실이지만 많고 많은 그래프 DB 중 기업에 가장 적합한 솔루션을 찾는 것이 가장 의미 있는 결정일 것입니다.

 

하지만 모든 것에는 항상 단점이 있듯, 그래프 DB도 마찬가지입니다. 그래프 DB의 주요 선택 이유는 흩어진 데이터를 통합하고 데이터의 관계를 분석하기 위함이지, 관계형 DB처럼 수많은 데이터에 대한 집계 용도로 사용되는 경우는 드뭅니다. 두 가지 모두 사용하며 효율을 높이고자 할 경우에는 두 가지가 혼합된 멀티모델 데이터베이스를 추천합니다. 이를테면 기존 방대한 데이터의 정확한 관리는 관계형 DB로, 그중 의미 있는 데이터만 추출한 관계 분석은 그래프 DB로 하는 것입니다. 이는 기존의 데이터 관리 패러다임은 그대로 유지하면서도 새로운 인사이트를 얻어내는 방법입니다.

 

 

멀티모델 그래프 데이터베이스, 아젠스그래프

비트나인의 멀티모델 그래프 데이터베이스 아젠스그래프(AgensGraph)를 통해 그래프 기술 도입을 고려한다면 다음과 같은 성능과 혜택을 체험해 보실 수 있습니다.

 

- 글로벌 1위 제품 대비 10배 이상의 빠른 속도의 질의 성능

 

- 기존 데이터 관리 시스템(관계형 DB)을 유지하면서도 새로운 그래프 기술 활용 가능

 

- 하이브리드 쿼리 (SQL & Cypher) 지원함으로써 데이터 관리 유연성 보장

 

- 숙련된 엔지니어와 분석가로 구성된 국내 최고 그래프 DB 전문가의 지원

 

아젠스그래프는 국내 많은 기업들의 실제 활용 사례들로 입증된 엔터프라이즈 DBMS입니다. 이는 안전하고 효율적인 데이터 관리 및 분석과 타의 추종을 불허하는 비즈니스 및 기술적인 이점을 제공합니다. 기존의 데이터 관리 시스템을 통합하거나 시스템 내 데이터의 의미를 파악하고 싶다면, 비트나인의 그래프 DB를 고려해 보시기를 바랍니다.

 


 

트렌디한 그래프 기술과 IT 소식을 뉴스레터로 받아보세요!

https://bitnine.net/ko/subscribe/

 

제품 및 기술문의

070-4800-3517  |   agens@bitnine.net