USE CASES/사례 연구

코로나 19(COVID-19)로 보는 데이터 시각화의 중요성

(주)비트나인 2020. 7. 29. 17:56

코로나 19로 보는 데이터 시각화의 중요성

 

코로나 19로 보는 데이터 시각화의 중요성

데이터, 서 말이라도 꿰어야 보배

최근 우리나라는 세계적으로 유행하고 있는 코로나 19 사태를 맞아 적극적인 검사와 진단, 확진자 동선 추적, 출입국 대상에 대한 격리 및 관리 등 효과적인 방역 체계를 구축하며 세계적인 찬사를 받은 바 있습니다.

 

그중에서도 독보적인 ‘확진자 동선 추적’ 시스템은 전국에서 발생한 확진자들의 이동 동선을 GPS 신호, 신용카드 이용 명세 등을 통해 수집하여 2주간 공개하고, 아래 [그림1]과 같이 각 지역 방문자들에게 핸드폰 알람을 발송해 해당 동선의 이용을 억제하는 방역 방법입니다.

 

[그림1] 확진자 이동 동선 안내를 위한 긴급재난 문자 및 이동 경로 안내 예시

※ 서울시 코로나19 이동동선 안내 [Link]

 

그러나 찬사 일색인 ‘확진자 동선 추적’ 시스템을 자세히 살펴보면, 아직 개선해야 할 여지는 많습니다. 특히 텍스트를 기반으로 이동 동선을 안내하는 방식은 그 한계가 뚜렷하다는 지적이 꾸준히 제기되어 왔습니다. 데이터를 한눈에 알아볼 수 있도록 시각적으로 표현하는 ‘데이터 시각화’라는 부분이 결여되어 있기 때문에, 확진자의 이동 동선 및 해당 지역의 방역 현황을 직관적으로 파악하기 어렵습니다.

 

데이터 시각화는 최근 코로나 19 사태를 맞아 더욱 주목받고 있는 분야입니다.

지난 4월에는 물류 운송기업인 CJ대한통운에서 이 데이터 시각화를 기업 홍보에 활용한 바가 있습니다. 당시 생필품 사재기에 대한 불안과 논란이 증폭되어가는 가운데 CJ대한통운은 31번 환자 발생 전후의 생필품 관련 택배 주문의 빅데이터를 수집했고, 아래 자료와 같이 간단한 선 그래프로 시각화했습니다. 총 1억 8천 건의 배송이 한눈에 보이는 이 자료를 통해, 사재기로 보이는 주문은 단 3일에 불과했다는 점, 그리고 택배가 위기 해결에 기여했다는 점을 효과적으로 홍보할 수 있었습니다.

 

코로나19 재택근무 본격화 전후 택배 데이터 분석

이 데이터는 홍보를 위해 새로 만든 것이 아니라 기존의 누적된 데이터를 활용한 것이었고, 아주 간단한 시각화만으로도 보는 이들에게 통찰을 제공할 수 있었습니다.

구슬이 서 말이라도 꿰어야 보배고, 백 번 듣는 것보다 한 번 보는 것이 낫다는 옛 말과 정확히 일치하는 맥락이라 볼 수 있습니다.

 

[그림2] 확진자 이동 동선 안내 시 사용자가 느끼는 궁금증 예시

그래프 DB로 구현한 코로나 확진자 맵

마찬가지로 서두에 언급한 ‘확진자 이동 동선’ 또한 텍스트 데이터를 DB화하고 데이터를 시각화한다면, 데이터를 더욱 직관적으로 파악할 수 있게 될 것입니다. 여기서는 관계를 직관적으로 표현하는 ‘그래프 데이터베이스(DB)’가 이동 동선 등의 관계를 표현하기에 가장 적합합니다.

 

우선, 기존의 공공 데이터(Source Data, [그림1])를 수집하여 DB화하면 아래 [그림3]과 같은 형태로 저장할 수 있습니다. 물론 여기서는 ‘시각화’라는 부분이 결여되어 있기 때문에, 이를 통해 통찰을 얻는 데에는 상당한 시간이 필요합니다.

 

[그림3] Relational DB의 Table 구조 (확진자 #15539 예시)

 

그래프 DB의 경우, 확진자 전체에 대한 이동 동선을 점(Node, 확진자, 방문 장소 등 객체)과 선(Edge, 이동수단)으로 데이터를 저장하게 됩니다. 이를 지도 등과 연계하여 실시간으로 한눈에 볼 수 있는 체계로까지 구축이 가능하고, 아래 [그림4]와 같은 형태로도 저장이 가능합니다.

 

[그림4] 그래프 DB의 Node-Edge 구조 (확진자 #15539 예시)

사실 위 [그림1]과 [그림3] 두가지 모두 확진자 1명에 대한 이동 동선 데이터를 볼 경우에는 큰 어려움이 없습니다. 하지만, 코로나 확진은 1명이 아닌 누적 13,879명(2020/7/22 기준)에 대한 이동 동선을 살펴봐야만 그 의미가 있습니다. 그래야 위험지대, 안전지대, 장소에 대한 구분과 이태원 클럽 등 특정 상황에서의 전파 상태 등을 인지할 수 있기 때문입니다.

 

따라서, 아래 [그림5, 6, 7]과 같이, 전체적으로 발생한 확진자들의 정보를 모두 통합할 필요가 있습니다. 이를 통해, 특정 확진자 기준뿐만 아니라 위치, 장소, 지하철 등 이동수단 등 다양한 기준으로 탐색이 가능합니다. 또한, 국민 개개인뿐만 아니라 방역 당국에도 거시적인 상황을 신속히 파악하고 통제할 수 있는 의사 결정의 근거를 마련해 줄 수 있기 때문에, 더 유용하고 효율적인 서비스가 가능해질 것입니다.

 

[그림5] 서울시 전체 확진자 화면

 

[그림6] 서울시 지역별 확진 영향도 화면

 

[그림7] A 클럽발 확진자 전파 상태 화면

데이터 속 숨은 진주 찾기

이처럼, 같은 데이터를 가지고도 어떻게 활용하느냐에 따라 큰 차이가 있음을 알 수 있습니다. 빅데이터 활용의 중요성은 날로 커지고 있고, 데이터에서 통찰을 얻고 활용하기 위해서는 반드시 시각화라는 단계가 필요합니다. 비단 코로나 19 사태 및 예시로 소개해 드린 확진자 동선 등 뿐만 아니라 사회, 산업 모든 분야에서 그 사례들을 쉽게 찾아볼 수 있습니다.

 

그러나 단순히 데이터를 보기 좋게 나열하는 것만으로 모든 문제를 해결할 수는 없습니다. 데이터의 숨은 정보를 찾아내 단순화하고, 그 관계에 대한 힌트를 찾아내야 하는 것이 스마트한 활용법의 핵심입니다. 이는 그래프 데이터베이스(DB)라는 기술이 해당 분야에서 가장 최적화된 솔루션으로 주목받고 있는 이유이기도 합니다. 그래프 DB를 활용하면 각 데이터 간 상관관계, 중요도, 패턴을 분석해 의사 결정의 근거를 마련할 수 있습니다. 설득을 위한 강력한 수단으로 활용해 새로운 통찰력을 얻어낼 수도 있습니다.

 

이미 미국 등의 글로벌 그래프 DB 시장은 상당한 규모로 발전해 적극적인 연구·개발(R&D)이 진행 중이고, 이미 많은 글로벌 기업들이 그래프 DB를 활용 중으로, 2023년에는 2020년 대비 약 3배의 고성장세를 이어갈 것으로 예상되고 있습니다. (출처:Markets and Markets)

우리도 이런 글로벌 트렌드를 간과할 순 없겠습니다. 데이터 시각화, 데이터 분석, 그리고 그래프 데이터베이스, 무엇이 됐든 이제는 정말 시작해볼 때입니다.

 

“데이터 분석과 데이터 시각화는 미래를 변화시키는 힘이 있다. 사회가 생각하고 행동하는 방식에 영향을 줄 수 있다.” (포브스, 2019.2)



글 : 정우철(비트나인 플랫폼·시각화 기획팀 / 팀장)


데이터로 연결하는 스마트한 세상, Bitnine

AgensGraph 무료로 다운받아 체험해 보세요

https://bitnine.net/agensgraph-downloads/