"그래프DB, 초연결 지능화 시대 핵심기술이다"
[인터뷰] 비트나인 강철순 대표
"현재 한국에 제품형태의 그래프 데이터베이스(DB)는 비트나인의 아젠스그래프밖에 없다. 그래프 DB 기술은 개체 간의 관계를 지어주는 것인데, 뭔가 연관관계 있는 데이터를 관리할 때 유용하다. 최근 인공지능, 지식그래프 등 파생 형태로 그래프 기술이 국내외에서 각광받고 있다. 그래프 DB는 모든 데이터를 직관적으로 연결할 수 있기 때문에 대량의 데이터 간 연결 관계를 분석하는 기술이자, 초연결 지능화 시대의 핵심 기술로 중요성이 높아지고 있다."
그래프 DB 솔루션전문업체 비트나인의 강철순 대표는 최근 본지와 인터뷰에서 이같이 밝혔다.
비트나인은 2013년 설립된 회사로 2017년 우리나라 최초의 그래프DB 솔루션 ‘아젠스그래프(Agensgraph)’를 출시해 공급하고 있다.
그래프DB는 기존 관계형데이터베이스(RDB)와 달리 대규모 데이터 사이의 모든 관계를 보여주는데 특화된 기술이다. 데이터를 연관성에 초점을 맞춰 관리하고, 복잡한 쿼리를 처리하는데 유리하다. RDB에서 쓰이는 테이블 대신 노드와 속성, 엣지, 릴레이션십 등으로 데이터를 정의하고 저장한다.
그래프DB가 세간에서 유명세를 타게 된 계기는 2016년 파나마페이퍼스 사건이었다. 파나마 페이퍼스는 파나마의 법률회사 모색폰세카에서 유출된 내부 문서로, 각국 전현직 지도자와 정치인, 유명인사의 조세회피 의혹을 담고 있다. 당시 이 문서를 파헤친 국제탐사보도언론인협회(ICIJ)는 데이터 분석과 시각화에 NEO4j 그래프 DB 기술을 사용해 문건 내 인물 간의 연관성을 직관적으로 보여줬다.
전세계적인 인지도를 가진 네오포제이를 비롯해, 2018년부터 아마존웹서비스(AWS)의 ‘넵튠’이란 그래프DB 서비스가 제공되고 있다. 파나마페이퍼스 사건이 2016년이었다는 점을 감안할 때 2013년부터 그래프DB 기술을 개발하기 시작한 비트나인의 출발은 매우 빨랐다.
강철순 대표는 “기존의 RDB 구조가 데이터 관리에서 한계를 드러내면서 그래프 기술과 그래프 DB 기술의 필요성이 대두되고 있다”며 “비트나인의 아젠스그래프는 정형 및 비정형 형태 데이터를 모두 처리할 수 있는 멀티모델 그래프DB로 고객의 보유 데이터를 빠르게 분석하고, 시각화된 결과를 얻어 이를 통해 비즈니스 인사이트 결정할 수 있게 한다”고 설명했다.
가트너는 작년 상위 10대기술 트렌드에 그래프DB를 포함시켰다. 가트너는 그래프DB 시장이 2022년까지 연간 100% 성장하고, 2025년 6조원 규모로 성장할 것으로 예상했다.
그래프DB의 활용가치는 무궁무진하다 할 만하다. 소셜미디어 분석, 인공지능(AI) 추천 엔진, 유통, 진단, 사기방지, 게놈 시퀀싱 등이 대표적인 활용 사례다. 또한 그래프 기술은 데이터 간의 연결관계 분석을 통해 인사이트를 도출하는 ‘그래프 AI’의 기반 기술이기도 하다. 다중관계(Multi Layer&Connected Network) 구조인 ‘지식 그래프(Knowledge Graph)’로 정보를 연결하는 과정을 거쳐 실제 인간의 뇌 구조와 가장 유사한 형태로 데이터를 처리하는 방식이다. 이를 이용하면 인간의 개입을 최소화해 의사 결정의 신뢰도를 높임으로써 기존의 AI 기술보다 더 효율적인 결과를 도출할 수 있다.
아젠스그래프 역시 데이터 분석, 사기방지, 유통 등의 분야에서 다양한 사례를 만들어내고 있다.
최근 기업의 마스터데이터관리(MDM) 분야에서도 고객 데이터 간 관계를 중요시 여기면서 아젠스그래프가 국내 대기업에 공급돼 쓰이고 있다. 마스터데이터 정의를 그래프로 해놓고, 실제 데이터 있을 때 매핑을 시켜주는 역할을 하고 있다.
강철순 대표는 “기업의 성과관리 시스템에서 작업성과를 관리하고 평가할 때 개별 업무를 정의하고 업무별 선후관계나 영향도를 파악하는데 그래프 DB 기술이 쓰인다"며 “업무 영향도 맵이 있어 새 작업을 할 때 어떤 영향 주는지 파악하고, 이상이 있을 때 역추적해 원인을 파악하는 게 가능하다”고 말했다.
그는 이어 “그래프 DB는 교육기관에서 학생에게 AI 기반 맞춤형 학습을 제공하는데 쓰이기도 한다”며 "학생의 현재 수준에 맞는 문제와 진도를 추천하는데 사람의 개입을 없애고, 자동처리하는데 활용되는 것”이라고 설명했다.
그는 “단원 간의 연관성과 의존성을 정의해 하나의 그래프로 연결하고 성취도에 따라 학습 프로그램을 조정할 수 있다”고 덧붙였다.
그래프DB를 활용하면 금융권에서 대포통장 기반 사기를 방지할 수 있다. 통장의 소유주와 관련 정보를 기반으로 여러 통장 사이의 유사도를 분석하고, 대포통장인지 찾아내는 것이다. 바이오 신약개발에서 성분과 질병 증상 등 의약정보 간 관계를 그래프로 연결해 분석하기도 한다.
강철순 대표는 “2006년 IBM에 입사해 약 9년간 근무하며, 글로벌 신기술에 관심을 갖기 시작했고, 남을 뒤따라가기보다 앞서가고, 희소성을 기반으로 시장의 진입장벽이 높은 기술을 개발하고 싶었다”며 “이런 고민을 할 시점에 데이터 분석 시장 환경의 진화와, 데이터 양 증가에 따른 기업 운영 복잡성의 증가 등을 해결할 방안으로 기존과 다른 그래프 형태의 기술에 호기심이 생겼다”고 창업 계기를 설명했다.
그는 “데이터 용량이나 종류에 상관없이 효율적으로 분석이 가능한 그래프 DB가 신기술로써 미래 IT 환경의 기반 기술이 될 것이란 확신이 있었다”고 덧붙였다.
아젠스그래프는 시장 수요를 반영하기 위해 멀티 모델로 설계됐다. 기반 메커니즘을 포스트그레SQL로 삼고, 그래프 부분을 입혀 개발했다. 이 덕에 정형 데이터부터 비정형 데이터 모두 동일한 엔진으로 별도 변환 작업 없이 그대로 통합 질의, 분석할 수 있는 특장점을 갖게 됐다.
강 대표는 “멀티모델 구성을 통해 데이터 모델링 및 데이터 수집의 비용이 절감되고, 적재적소에 맞게 저장하고 분석이 가능하기 때문에 개발 방향성을 멀티모델 그래프 데이터베이스로 정립하게 됐다”고 말했다.
비트나인은 올해 아젠스그래프의 업그레이드를 준비중이다. 포스트그레SQL 사용자가 기존의 DB 내 데이터를 그래프DB처럼 바로 활용할 수 있는 포스트그레SQL 익스텐션을 개발했다. 그리고 그성과물인 ‘AGE’를 대표적인 오픈소스재단 아파치소프트웨어재단에 제출했다. AGE는 최근 아파치소프트웨어재단의 인큐베이션프로젝트로 선정됐다.
강 대표는 “작년 이맘때부터 새 제품으로 아젠스그래프 익스텐션을 개발하면서 아파치소프트웨어재단에 기부하고 알파버전으로 선보였다”며 “연말 베타버전을 내놓고, 내년 정식 버전을 내놓을 예정”이라고 밝혔다.
그는 “원래 포스트그레는 다양한 익스텐션을 특징으로 하는데, 그래프 분야는 AGE가 유일해 아파치재단에서도 그점을 높이 평가했다”며 “인큐베이션 프로젝트 신청을 위해 챔피언과 멘토 4명을 선정해야 하는데, 한국색을 배제하기 위해 일부러 미국 현지인만 모시기도 했다”고 덧붙였다.
그래프DB는 RDB와 전혀 다르기 때문에 쿼리 언어를 다르게 쓴다. 그래프 전용 언어가 있는데, 그렘린, 스파크QL, 그래프QL, 오픈사이퍼 등이 대표적이다. 아젠스그래프는 가장 활성화된 그래프DB 커뮤니티인 NEO4j의 오픈사이퍼를 채택해 쿼리언어로 사용한다.
비트나인은 글로벌 시장 진출을 위해 2016년 미국 지사를 설립했다. 그 성과로 인텔에 OEM 형태로 그래프DB를 납품하고 있으며, 글로벌 라이선스 공급사례를 다수 만들었다.
비트나인은 현재 보유한 그래프 DB 기술과 자연어 처리 기반의 AI 기술을 접목한 그래프 AI 제품을 출시할 예정이다. 챗봇, 자동문서인식, 의사결정시스템 등의 활용성을 높이게 될 것이라고 회사측은 설명했다.
강 대표는 인재 확보에 계속 신경쓰고 있다고 했다. 그는 “비트나인은 기술 중심 회사기 때문에 구성원 각각의 역량을 중요하게 본다”며 “아직 미숙하더라도 미래 예측력과 자기주도 학습력을 지닌 지원자는 비트나인에 적합한 일원이라 생각한다”고 말했다.
그는 회사의 이름을 설명하며 앞으로 비전을 밝혔다. 올해 연매출 180억원을 목표로 하고 있다. 강철순 대표는 어럽지 않게 달성할 것으로 예상했다.
그는 “비트나인이란 회사명은 ‘비트(bit)’가 모여 8비트가 되면 1바이트(Byte)로 단위가 넘어가는데, 이 때 숨겨진 9번째 비트를 찾는다는 의미”라며 “데이터 연결을 통해 숨겨진 인사이트를 제공하는 가치를 가진 기업이 되고자 하는 뜻을 담고 있다”고 밝혔다.
그는 “올해 AI로 사업 영역을 확장하고, 글로벌 사업 역량도 강화해 매출 채널의 다각화를 구상하고 있으며, 이러한 전략을 바탕으로 꾸준한 성장을 이어나갈 것”이라며 “국내에서 독보적인 ‘그래프 AI기술’ 선두 기업이 되는 것뿐 아니라, 사업의 이익만을 추구하는 게 아니라 온오프라인 IT 세미나를 꾸준히 개최해 개발자간의 소통의 장을 활성화시키는 사회의 이익 또한 지지하는 기업이 되고자 한다”고 덧붙였다.
▷ 출처 : ZDNet Korea
▷ 원본 링크 : https://zdnet.co.kr/view/?no=20200814115010
'RESEARCH & REPORT > 그래프 기술' 카테고리의 다른 글
2020 가트너 10대 데이터 분석 트렌드 (0) | 2020.09.07 |
---|---|
[기고] 그래프 기술의 가치…표현, 발견 그리고 추론 (0) | 2020.08.25 |
초연결 지능화 시대 개막, 주연은 그래프 DB (0) | 2020.08.06 |
그래프 DB가 ‘밥’ 먹여준다 (0) | 2020.08.04 |
[기고]4차 산업혁명시대, 빅데이터 강국의 열쇠는 '데이터베이스' (0) | 2020.03.30 |