RESEARCH & REPORT/그래프 기술

그래프 시각화 : 복잡한 관계를 한눈에 보여주는 기술 - Part. 1

(주)비트나인 2023. 1. 18. 13:54

 

그래프 시각화(Graph Visualization)란?

그래프 시각화라는 용어가 낯설게 느껴질 수 있지만, 우리는 이미 그래프 시각화의 필요성에 대해 직·간접적으로 느껴본 적이 있습니다. 소셜 미디어(Social Media, SNS)는 인물을 중심으로 개인과 개인, 개인과 집단의 관계를 연결해 주는데, 단순한 연결을 넘어 상호작용뿐 아니라 정보 전달의 역할도 함께 합니다. 따라서 소셜 네트워크의 구조와 정보 흐름의 패턴을 함께 이해하면 더 효과적인 매체에 사용될 뿐 아니라 정보 흐름에 대한 제어도 가능합니다.

 

그래프(네트워크)는 시간의 흐름에 따라 급격하게 진화하는 체계이기 때문에 각 구성 요소를 이해하는 것만으로는 완벽하게 설명되지 않습니다. 그러므로 네트워크라고도 불리는 그래프의 구조적 특성과 변화 과정을 이해해야 합니다. 

 

그래프 이론이 수학과 물리학 양쪽에서 쓰이다 보니 용어가 통일되지 못한 면이 있습니다. 하지만 근본적인 의미는 같으므로 노드 (node or vertices, vertex), 관계 (link or edge), 속성(property)으로 구성되어 있고, 이런 노드 간의 관계를 그래프 DB에 저장하며 데이터 간의 연결·상관관계를 분석하고 가시적으로 시각화한 것을 그래프 시각화(그림1)라고 합니다.

 

<그림1.그래프(네트워크)의 개념도> 참고:https://www.en-core.com/service/service12

 


그래프 시각화, 왜 필요한가?

범죄 수사와 관련된 수많은 영화와 드라마에서 형사들이 벽에 다양한 사진과 신문 시사 스크랩을 붙여놓고 뚫어져라 바라보며 사건의 실마리를 잡아내는 장면은 누구나 한 번쯤 접해 보았을 것입니다. 그림 2처럼 아무 관련 없어 보이던 요소들을 차례로 이어나가면 주변 상황과 인과 관계가 종합적으로 보입니다. 이런 방법으로 추론을 거듭하면 이전에 발견하지 못했던 새로운 실마리를 발견하게 됩니다. 여기서 쉽게 알 수 있는 것이 Visualization, 즉 시각화의 중요성입니다. 많은 데이터를 한눈에 확인할 수 있다면 종합적인 판단이 가능하게 되고, 이는 새로운 인사이트를 발견할 수 있는 결정적 단서가 됩니다.

 

<그림2. Detective Board (탐정 게시판이라고 불리는 수사기법) >

 

 

이를 비즈니스 영역에 입각하여 생각해 보면 4차 산업혁명 시대의 비즈니스는 데이터로 시작해 데이터로 끝날 만큼 데이터의 수집과 분석이 매우 중요합니다. 하지만 시간이 흐를수록 그 데이터 양이 너무 방대한 나머지 제대로 활용을 못하는 실정입니다.

 

또한 공급부터 수요까지의 데이터를 바라보는 시각과 이해의 방식도 비즈니스 밸류체인 내의 각 영역 담당자마다 모두 다릅니다. 예를 들어 반도체 공장의 공급자는 부품의 규격과 수량 데이터에 집중하고, 생산자는 설계 정보와 부품 공급 데이터에 집중하며, 판매자는 완성 반도체의 판매량이나 마케팅에 초점을 맞춰 데이터를 바라봅니다. 이렇게 단절된 시야 속에서 데이터 흐름은 리스크에 대한 근본적인 원인 탐색과 대비를 막막하게 하여 비즈니스 성과도 어렵게 만듭니다.

 

하지만 실제로는 비즈니스 밸류체인 내의 모든 데이터가 서로 복잡한 관계와 흐름을 가지고 있습니다. 대부분의 기업이 관계형 DB 구조의 엑셀 같은 행(column)과 열(row)의 테이블로써 관리해오고 있지만 보기가 힘들고 이를 활용하기엔 한계가 있습니다. 따라서 새롭게 데이터를 바라보는 적절한 대안으로 그래프 DB와 그래프 시각화(Graph Visualization)의 중요성이 대두되고 있습니다.

 

다양한 기업들의 밸류체인에 분절된 데이터들을 점과 선으로 연결하여 입체적인 구조로 시각화합니다. 이를 통해 직관적인 탐색이 가능해집니다. 그리고 이 데이터의 복잡한 연결 관계를 시각적으로 패턴화 하여 지식 체계를 단순화하는 것입니다. 여기에 실마리가 있습니다. 그래프 시각화의 가장 중요한 목표인 빠른 데이터 탐색으로 인한 분석이 가능해집니다. 근래 주목받는 키워드인 고객 360도 뷰(Single Customer View)(그림 3)의 핵심적인 내용과도 상통합니다. 

 

<그림3.Customer 360 view example graph> 참고: https://neo4j.com/blog/graphs-in-automotive-and-manufacturing/

 

 

그래프 시각화가 중요한 근본적인 이유가 여기에 있습니다. 고객 데이터를 다각적으로 살펴봐야 하는 것처럼, 방대한 영역의 밸류체인 데이터에 보다 편리하고 체계적으로 접근하여 활용할 수 있도록 돕는 것입니다.

 

그래프 시각화 접근 방식을 사용하면 기술 사용자 및 비기술 사용자 모두 데이터를 쉽게 인지하며 조사 및 관리가 가능해집니다. 이렇듯 연결된 데이터의 통찰력을 발견할 수 있는 그래프 시각화는 그 자체만으로도 의미가 있습니다. 

 

데이터 간의 상관관계를 한눈에 파악하려면 테이블 기반의 예제 모델(그림4)보다 그래프 시각화의 예제 모델(그림 5)이 더 효과적인 것을 아래 두 예시를 보며 이해할 수 있습니다. 

 

<그림4.테이블 기반 예제 모델>

 

<그림5.&nbsp;Linkurious Enterprise로 만든 그림3의 예제 모델을 그래프 시각화 - 투자자 (파란색), 회사 (녹색) 및 시장 (주황색)을 나타내는 9 개의 node와 연결 방법을 나타내는 8 개의 edge.> 참고: https://www.datasciencecentral.com/5-reasons-why-graph-visualization-matters/

 

 

이와 같이 그래프 시각화는 일반적인  테이블 형식으로는 볼 수없는 데이터 간의 관계성을 명시하고 데이터 간의 상관관계에서 생성되는 인사이트와 비중을 찾아내는 것에 최적화되어 있습니다. 이는 곧 정보를 그래프에 저장하여 상호 연결성이 높은 데이터를 효율적으로 시각화해 탐색할 수 있는 환경을 제공합니다.

 

결국 그래프 시각화는 방대하게 연결된 데이터를 더 잘 이해할 수 있는 완벽한 방법입니다. 앞서 설명했던 내용을 토대로  5 가지 특징으로 요약하자면 다음과 같습니다.



1. 데이터의 정보를 인지하는 시간 단축

인간의 뇌는 시각 정보를 기록된 것보다 훨씬 빠르게 처리합니다. 시각적으로 데이터를 표시하면 이해 시간이 빨라져 결국 작업 및 분석 시간이 단축됩니다.

 

2. 통찰력을 발견할 수 있는 더 높은 기회

데이터와 상호 작용함으로써, 그래프 시각화 도구는 데이터를 조작할 수 있는 가능성을 제공합니다. 이는 결국 데이터를 이해하고 행동 가능한 통찰력을 발견하게 됩니다.

 

3. 맥락에 대한 더 깊은 이해

문제에 대한 패턴과 상황을 그래프로 시각화함으로써, 그래프 시각화는 데이터 관계를 시각화하여 데이터의 맥락을 이해하는데 효과적입니다. 이는 데이터의 추세와 상관관계를 식별할 수 있는 모든 연결 방식에 대한 전체 개요를 볼 수 있게 됨을 의미합니다.

 

4. 효율적인 커뮤니케이션 방식

시각적 표현은 데이터를 보다 직관적으로 이해할 수 있는 방법을 제공하고, 시각적 매체를 통해 의사 결정자들과 결과를 공유하고 정보를 전달하고 전파하는데 파급력이 크다고 볼 수 있습니다.

 

5. 높은 접근성

특정 프로그래밍 기술로 상호작용하지 않아도 되므로 더 많은 사용자가 통찰력에 참여할 수 있습니다. 이는 가치 창출의 잠재력을 보다 더 극대화하여 높일 수 있습니다.

 

다시 한번 아래 테이블 데이터 샘플(그림. 6)과 그래프 시각화(그림. 7)의 예제를 통해 앞서 설명했던 내용들을 복습하겠습니다.

 

<그림6.테이블 개인 데이터 샘플 .>

 

 

<그림7.그림.5의 그래프 시각화> 참고: https://zephyrnet.com/ko/%EA%B7%B8%EB%9E%98%ED%94%84-%EC%8B%9C%EA%B0%81%ED%99%94%EA%B0%80-%EC%A4%91%EC%9A%94%ED%95%9C-5-%EA%B0%80%EC%A7%80-%EC%9D%B4%EC%9C%A0/

 

 

두 번째 형식(그림 7)에서는 그래프를 생성하기 위해 사람 간의 연결을 방향성의 edge로 모델링했습니다. 첫 번째 표(그림 6)에서는 이러한 사람들이 어떻게 협력하는지 이해하기가 매우 어렵지만 그래프 시각화(그림 7)를 통해 직관적으로 더 명확한 관계를 얻을 수 있습니다. 우리는 두 그룹과 그들 사이의 연결 고리인 것처럼 보이는 개인을 구별할 수 있는데, 이는 처음의 표 형식(그림. 6)에서는 발견하기 힘든 패턴입니다.

 

2부 예고: 그래프 시각화 툴킷과 사례

앞선 이유에서라도 여러 기업에서 그래프 시각화를 통해 비즈니스에서의 의사결정을 도와주는 형태로 솔루션들이 나타나고 있습니다. 그렇다고 오해해서는 안 될 것은, 관계형 DB보다 그래프 DB가 우월하다는 것은 아닙니다. 데이터 시각화를 통하여 정보 전달의 매체로 활용하는 것에 대해서는 범위를 제한해서는 안될 것입니다.

 

그래프 네트워크는 아직 일반인들에게는 익숙하지 않은 형태이기 때문에, 일반적인 데이터 시각화 영역에서의 차트나 라인 그래프 등과 같이 활용하면 정보전달의 매개체로서 보다 더 깊은 의미를 가질 것입니다.

 

빅데이터 분석 트렌드만 보더라도, BI(Business intelligence)보다 진일보한 빅데이터 분석 방법으로 BA(Business Analytics) 분석 트렌드로 진화하고 있습니다. 기본적인 BI를 포함하면서도 미래 예측 기능과 통계분석, 확률 분석 등을 포함해 최적의 데이터 기반 의사 결정을 가능하게 하고 있습니다.

 

이와 관련해서는 2부에서 그래프 시각화 툴킷과 사용되는 사례를 알아보겠습니다. 

 

 

글: 허진호 책임  (비트나인 그래프서비스분석팀)


제품 및 기술문의

070-4800-3517  |   agens@bitnine.net