그래프 2

[기고] 그래프 기술의 가치…표현, 발견 그리고 추론

데이터를 다루는 방법들이 다양해지고 있다. 최근 정보기술의 발달과 더불어 데이터양의 폭발적인 증가 및 데이터 유형의 다양화로 인해, 기존의 관계형 데이터베이스 이외에 목적 지향적인 데이터베이스의 활용이 증가하고 있는 추세이다. 더욱이 국내 기업들 사이에서 확산되고 있는 탈(脫)오라클 현상과 오픈소스 프로그램 활용의 증가로 인해 데이터를 수집, 가공, 적재 및 분석하는 기법들이 다양하게 발전하고 있다. E.F 코드(Codd)가 1970년 주창한 관계형 데이터베이스 이론은 대용량 데이터를 제한된 컴퓨팅 자원을 활용해 '효율적으로' 관리하기 위한 방안이었으나, 최근 컴퓨팅 자원의 성능 증가 및 가격 하락으로 인해 효율적인 관리보다는 “효과적인” 관리가 관심을 끄는 동인이 되고 있다. 목적 지향적인 데이터베이스..

대용량 그래프 처리 시스템, Pregel

대용량 그래프 처리 시스템, Pregel 세상에 그래프로 나타낼 수 있는 항목들이 많이 있습니다. 전통적으로는 대도시 대중교통의 노선 설정, 전염병의 전파경로, 논문표절탐지 등이 있으며 요새는 SNS의 사람과 관계를 분석하는 것이 아주 인기가 높습니다. 이런 그래프들을 분석할 때 가장 흔하게 사용하는 것이 최단 경로 탐색이고 또 유명한 것으로 구글을 현 위치에 있게 한 페이지랭크 알고리즘도 있습니다.. 그 밖에도 여러가지 그래프로부터 흥미로운 결과를 도출할 수 있지만 문제가 한 가지 있습니다. 거대한 그래프를 다루는 것은 어려운 문제입니다. 최적의 알고리즘을 선택해도 소모 비용이 지수적으로 증가하는 것이 보통입니다. 결국 단일 머신에서의 한계에 금새 다다르게 됩니다. 계산과정을 모두 메모리에 적재하고 수..

ARCHIVES 2016.03.14