그래프 DB가 ‘밥’ 먹여준다
원제 : A Graph DB Helping to Solve World Hunger
게임, 인공지능, 데이터 과학 및 컴퓨팅에 관한 글을 작성해오고 있는
영국(런던)의 프리랜서 테크니컬 라이터
번역자의 말
이 글은 영국의 테크니컬 라이터(Technical Writer)인 조 스티치버리(Jo Stichbury)가 그래프 데이터베이스의 활용 사례에 대해 소개하는 내용으로, 지난 2019년 미국의 IT 전문 매체인 DZONE에 기고한 내용을 번역 및 편집한 글입니다.(원제: A Graph DB Helping to Solve World Hunger) UN 산하의 세계 최대 인도주의 구호단체에 소속된 데이터 과학자들이 그래프 데이터베이스(DB)를 사용하여 식량 안보가 취약한 지역을 찾아 문제를 해결하는 방법에 대해 소개하는 내용으로, IT 기술이 우리의 삶에 어떤 긍정적인 영향을 미칠 수 있는지에 대해서 살펴보고자 합니다.
굶주린 이들을 위한 WFP의 노력
우리는 역사상 가장 풍요로운 시대에 살고 있습니다. 그러나 지구 반대쪽 한편에서는 전쟁, 홍수, 태풍, 지진 등의 재해를 겪고 있는 난민들, 그리고 심각한 병을 앓거나 영양실조로 굶주리는 이들이 점점 늘어나고 있습니다. 이런 사람들을 찾아 지원하는 UN의 세계식량계획(World Food Programme, WFP)에 따르면 매일 밤 약 8억 2100만 명이 공복 상태로 잠자리에 들고, 세계 인구의 3분의 1이 영양실조에 시달리고 있다고 합니다.
WFP는 매년 83개국, 9,140만 명에 달하는 굶주린 사람들을 돕기 위해 매일 5천 대의 트럭과 20척의 선박, 그리고 92대의 항공기로 구호물자를 보내고 있습니다. 물류 배송을 통해 식량 위기에 효과적으로 대응할 수 있도록 철저히 준비하는 것입니다.
이 활동의 배경에는 VAM(Vulnerability Analysis and Mapping, 취약성 분석 및 대응)이라는 정보 공유 프로그램을 사용하는 200여 명의 ‘식량안보 분석가(Food Security Analyst, 이하 분석가)’들이 있습니다. 이들은 소말리아, 남수단 및 예멘을 포함한 70개국 이상의 지역에 파견되어 해당 프로그램을 통해서 지역별 식량난의 원인을 파악하고, 각국의 난민들에게 필요한 도움을 적시에 제공하는 역할을 합니다.
이를 위해 분석가들은 경제 상황 분석, 지리 공간 분석 등을 포함한 다양한 데이터를 수집하며, 그 과정에서 대면 및 전화 인터뷰를 통해 각 지역의 특성까지 파악해내고 있습니다. 인터뷰 과정에서는 더욱 상세한 상황 진단을 위해 400문항 이상으로 구성된 설문조사를 병행하고 있으며, 매년 수천 세대가 넘는 가정, 식량 공급 업체와 접촉하고 있습니다.
설문의 각 문항은 매우 체계적으로 짜여 있기 때문에, 이를 데이터베이스로 축적해보면 상당히 많은 양과 복잡한 구조로 나타남을 알 수 있습니다. 그리고 그 과정을 통해 얻은 인사이트는 다음과 같습니다.
1. 위험에 처한 모든 지역에 대한 건강, 생계 및 사회 경제적 변수를 포함한 통합 표준을 만드는 것은 불가능하다.
2. 다양한 관계의 많은 변수가 존재한다. (WFP의 데이터 과학자는 “식량(Food)은 단지 음식으로만 볼 수 없다. 시골 지역에서의 식량은 농사를 짓기 위한 수단일 수도, 또 운송 수단이나 판매의 수단일 수도 있다”고 표현)
데이터의 활용 방안 연구
지금부터는 수집한 데이터를 활용해 어려움에 처한 지역과 그 사람들을 찾아낸 사례에 대해 소개해 드리겠습니다. 먼저 분석가들은 식품 소비 및 지출 데이터, 다양한 식품 그룹과 측정 단위, 통화 및 여러 식품 공급원(식품을 시장에서 구매했는지, 집에서 재배했거나 정부가 제공했는지에 대한 여부 등)에 대한 데이터를 모두 수집한 후 통합했습니다. 그리고 누적된 이 엄청난 양의 데이터를 보관, 관리하기 위한 방법을 찾아야 했는데, 바로 그래프 데이터베이스(DB)로 그 해결책을 찾을 수 있었습니다. 그들은 그래프 DB 솔루션인 비트나인의 아젠스그래프(AgensGraph)를 사용해 변수 간의 관계를 기록해 데이터를 구성했고, 복잡한 데이터셋의 정보를 쉽게 이해할 수 있게 되었습니다.
이 업무를 담당했던 WFP의 데이터 과학자 Singhal은 Postgres Conference Silicon Valley 2018에서 “그래프 DB인 아젠스그래프를 사용해 데이터를 쉽게 집계하고 통합할 수 있었다”고 언급하기도 했습니다.
기업들은 기존 RDBMS(Relational Database Management System, 관계형 데이터베이스 관리체계)로는 다양한 데이터 형식과 빠르게 변화하는 트렌드를 따라갈 수 없다고 판단했습니다. 그 과정에서 NoSQL의 그래프 데이터베이스(DB)는 데이터 커뮤니티에서 가장 강력한 기술로 자리매김했습니다. 가트너는 선두 그룹에 있는 기업의 70% 이상이 그래프 DB 프로젝트를 사용할 것으로 예측하기도 했습니다.
아젠스그래프는 PostgreSQL 기반의 멀티 모델 그래프 데이터베이스로, 관계형 데이터와 그래프 데이터 모델을 하나의 데이터베이스에 통합 할 수 있습니다. SQL과 Cypher를 동시에 사용할 수 있으므로 개발자는 데이터 관리를 위한 레거시 SQL 환경과 함께 그래프 데이터베이스의 기능을 활용할 수 있습니다. PostegreSQL 사용자에게는 확장 기능을 지원해 관계형 데이터를 그래프로 쉽게 이전(마이그레이션)할 수 있게 했습니다. 또한, 아젠스그래프는 ACID 트랜잭션, MVCC, 트리거 및 JSON과 같은 기능과 그래프를 시각화하여 실제 세계의 직관적인 모델을 형성하는 브라우저도 지원합니다.
아래 그림에 나타난 예시는 WFP의 지원금(식량 구매비)을 받는 인구의 식습관에 관한 연구를 모델링으로 표현한 것입니다.
그래프의 엣지(edge)와 특징(properties)가 나타내는 정의는 다음과 같습니다.
-
식품군(고기)을 소비하는 가정
-
식품군(고기)가 함유한 영양분
-
해당 식품군에 대해 소비가 이루어지는 가정
WFP는 위의 간단한 예제 데이터를 통한 그래프 데이터베이스 쿼리와 추론으로 다음과 같은 인사이트를 얻어낼 수 있었습니다.
-
영양실조 문제가 심각한 가정의 파악
-
음식 소비 패턴 분석과 일치하는 품목의 유통 우선순위 지정
-
지속 가능성을 위한 적절한 영양 교육 프로그램 계획 설계
그래프 데이터베이스 모델링으로 표현한 위 시나리오와는 별개로 다른 인사이트를 찾아낼 수도 있습니다. WFP는 지원금을 받는 가정 중에서 영양성분이 함유된 식품을 제대로 챙기지 않는 경우도 많을것이라 추측했습니다. 다음의 두 쿼리는 지원금을 영양 성분의 함유와는 무관하게 엉뚱한 곳에 사용하는 가정들을 찾아내기 위한 과정에 대해 설명합니다.
위 <쿼리1>의 설탕과 비타민A의 섭취 횟수를 비교해 아래 그림과 같이 <그래프1>로 시각화했습니다.
43개의 가정 모두 설탕 함유 식품을 섭취했지만, 그중에서 일부의 가정만이 비타민A를 섭취했다는 것을 알 수 있습니다. 이는 비타민A에 대한 인식이 부족한 가정(사람)일 가능성도 있지만, 설탕 함유 식품밖에 구할 수 없는 지역의 거주자일 수도 있습니다. 우선, 섣불리 판단하지는 않기로 했습니다.
위 가정(사람)들이 정말 문제가 있는지 찾아내기 위해 위와 같이 <쿼리2>를 준비했습니다. 이 쿼리는 설탕 함유 식품을 일주일 동안 하루도 빠짐없이 구매하고, 비타민A 식품은 1번만 구매한 이력의 케이스들을 조회했습니다. 이는 지원금으로 비타민A 함유 식품을 구매할 수 있었음에도 불구하고 설탕 함유 식품만 구매한 가정을 찾아내기 위함입니다.
위 <그래프2>에서는 16개 가정에서 설탕이 함유된 식품을 구매했지만, 비타민A가 함유된 달걀과 채소를 구매한 가정은 단 1개에 불과함을 알 수 있습니다. 이에 따라 WFP는 비타민A의 중요성에 대한 인식이 부족한 가정에 대해 영양 교육을 진행했고, 지원금 대신 비타민A가 함유된 식품으로 교환할 수 있는 쿠폰을 도입하는 등의 솔루션을 내놓을 수 있었습니다.
(번역자 주: 비타민A는 건강(특히 눈 건강)을 유지하는데 있어 가장 중요한 영양소 중 하나로 계란 및 당근, 시금치 등의 녹황색 채소에 풍부하며, 영양 섭취에서의 ‘먹거리 불평등'이 빈번하게 발생하는 것으로 알려져 있습니다. 또한, 비타민A와 헴철(heme iron)은 10세 미만의 어린이의 성장에 필수적인 영양분이기 때문에 UN의 수석 과학자는 두 성분의 섭취 및 소비량을 중점적으로 파악한 바 있습니다.
아래 동영상에서는 아젠스그래프의 시각화 툴인 아젠스브라우저(AgensBrowser)를 통한 여러가지 시나리오에 대해 더 자세히 확인할 수 있습니다.
맺음말
WFP는 2030년까지 기아 문제 해결, 식량 안보 달성, 영양 문제 개선 등을 목표로 “제로 헝거 (Zero Hunger)”라는 슬로건을 내세우고 있습니다. 많은 진전도 있었지만, 아직은 갈 길이 멀어 보입니다. 이 목표를 달성하기 위해서는 정부와 민간 부문이 함께 협력하여 지속 가능한 솔루션을 개발해 나가야 할 것입니다.
참고정보
WFP는 비트나인의 아젠스그래프를 포함한 여러가지 첨단 IT 기술들을 사용해 오고 있습니다.
아젠스그래프의 커뮤니티 에디션은 AGPL 3.0(Affero General Public License, 반드시 소스 코드를 공개해야 한다는 제한 사항 추가) 라이선스가 부여되어 있고, 엔터프라이즈 에디션은 상용 라이선스가 부여되어 있습니다.
멀티모델 그래프데이터베이스AgensGraph
60일간 무료로 사용해 보세요
bitnine.net/agensgraph-downloads/
제품 및 기술문의
070-4800-3517 | agens@bitnine.net
출처: DZone
원문 링크: https://dzone.com/articles/agensgraph-a-graph-db-helping-to-solve-world-hunge
글 : Jo Stichbury (Freelance Technical Writer, England)
번역/검수: 서준섭, 오호준 (비트나인 전략마케팅팀)
'RESEARCH & REPORT > 그래프 기술' 카테고리의 다른 글
[인터뷰] "그래프DB, 초연결 지능화 시대 핵심기술이다" (0) | 2020.08.21 |
---|---|
초연결 지능화 시대 개막, 주연은 그래프 DB (0) | 2020.08.06 |
[기고]4차 산업혁명시대, 빅데이터 강국의 열쇠는 '데이터베이스' (0) | 2020.03.30 |
온라인 데이트를 변화시키는 그래프 데이터베이스 (발렌타인데이 Special) (0) | 2020.02.13 |
[Network Times] 2019년 4월호 Opinion 기고, 「빅데이터 핵심은 ‘데이터간 상관관계’」 (0) | 2019.04.12 |