ARCHIVES

BI & 데이터 분석 툴

(주)비트나인 2015. 12. 24. 16:53

[BI & 데이터 분석 툴]



 데이터 분석에 대한 관심이 높아지면서 너무나 많은 분석 툴이 쏟아져 나오고 있으며, 데이터 분석 수행 시 필요한 분석 툴들을 알아보고 각각의 분석 툴의 목적과 사용 방법에 대해 이해해 보도록 한다.




1. 데이터 분석 툴


데이터 분석이란 의미 있는 정보 획득 또는 의사 결정 지원의 목적을 달성하기 위해 데이터를 통해 이루어지는 일련의 과정1이며, 분석 툴은 사용자가 데이터 분석을 쉽게 접근하거나 특화된 분야 또는 특정 목적에 따라 적절한 기능들을 제공하는 것이라 할 수 있다.

, 데이터 분석 툴은 분석가를 도와 주는 도구일 뿐, 분석 그 자체가 될 수는 없다는 것이다. 따라서 분석 툴은 사용자의 분석 목적에 따라 적절한 선택이 필요하다.

분석 툴을 선택하기 위해서는 우선 분석의 접근법에 대한 이해가 필요하다. 관점에 따라 분석을 딱 잘라 나누기는 어렵고 또한 여러 이견이 있지만2 아래의 그림과 같이 크게 BI(Business Intelligence)와 고급분석(Advanced Analytics)으로 나누어 생각해 볼 수 있다. (2. Descriptive Analytics, Predictive Analytics, Prescriptive Analytics 로 나누어 생각할 수도 있다.)




그림 1.


사용자 입장에서 헷갈리는 부분이 바로 BI 와 고급 분석의 차이다.

BI 와 고급 분석의 가장 큰 차이는현황과 예측으로 구분 할 수 있는데, BI는 과거 데이터(현재 데이터 역시 이미 발생한 사건)의 현상과 현황을 파악(Descriptive)하는 것이라면, 분석은 현상과 현황을 통해 향후를 예측(Predictive)하고 더 나아가서는 최선의 대책(Prescriptive)이 되는 모델을 제공하는 것이다. 다음 그림과 같이 BI는 주로 무슨 일이 발생하였는가에 초점이 되고 고급 분석은”, 향후에는어떻게” 라는 질문에 초점을 가지게 되며 향후 발생한 일에 대한 대응을 잘한 기업이 경쟁에서도 우위를 갖출 수 있을 것이다.




그림 2.


고급 분석의 예측 모델 등을 생성하기 위해서는 BI에서 이루어지는 과거 데이터에 대한 현황을 파악하는 부분을 포함하고 있으나, 그 목적이 BI와 같이 축적된 데이터에 대해 잘 표현(탐색)하는 기능과는 차이가 있다. 혹자는 BI 도구를 통해 과거 데이터의 추세 그래프로부터 예측 가능하다고 생각할 수도 있지만, BI 도구를 통해서는 다양한 알고리즘의 적용 및 예측의 확률적 정확성, 오차의 크기, 신뢰성 등의 모델 정보를 얻을 수 없다.

 

[내용 인용] 엔코아 리포트(http://www.dator.co.kr/bmonthly/1879742)


 


2. BI와 고급 분석의 구분


BI와 고급 분석에 대한 간단한 예를 들면 다음과 같다.

당신이 회사의 영업 마케팅 담당이라고 생각하자. 관리해야 하는 매장의 수가 얼마 되지 않으면 매출에 대한 정보를 각 매장 별 엑셀 파일로 관리할 수 있을 것이다. 하지만 매장의 수가 수천 개에 이르면 엑셀을 통해 확인하기엔 어려움이 많다. 따라서 각 매장의 매출 데이터를 하나로 통합하여 저장(Data Warehouse, 이하 DW)하는 과정을 거치게 된다.

통합 저장을 하게 되면 이제 당신은

- 전체 매출은 얼마인가?

- 매출이 가장 많은 지역은 어디이며, 매출이 가장 높은 매장은 어디인가?

- 매출이 높을 때의 날씨는 어떠했는가?

- 매출이 가장 좋은 요일은 무슨 용일인가?

- 매출액의 규모는 어떠했는가?

등에 대한 정보를 얻을 수 있다. 정리하면언제’, ‘어디서’, ‘무엇을’, ‘얼마나 많이등에 관련된 질문이다. 이러한 과정을 통해 당신은 현재 회사의 현황 정보를 요약할 수 있을 것이다. 여기까지의 과정이 전통적인 BI를 통해 확인할 수 있는 내용이다. 그렇다면 BI 다음에 당신이 궁금한 것은 무엇일까?

- 날씨가 매출에 미친 영향은 얼마만큼이며, 과학적(수학적, 통계적)으로 수치화할 수 있는가?

- 지역 별 매출의 차이는 왜 발생했으며, 어떠한 지역에 신규 매장을 개점하는 것이 유리한가?

- 기존 매장들의 정보를 통해 신규 매장의 예상 매출은 어느 정도이며, 오차율은 어느 정도인가?

- 어떠한 프로모션을 진행하면 매출을 상승시킬 수 있을 것인가?

아마도 위와 같을 것이다. , ? 그리고 무엇을 어떻게 해야 하는가? 등에 대한 질문일 것이다. 이러한 부분이 고급 분석의 영역이다.




그림 3. BI와고급 분석


기존 BI 제품과 구분하는 이유는 최근 BI 기업들의 제품에 분석 시장의 요구에 따른 고급 분석 기능이 추가 되고 있기 때문이다.

그 중 대표적인 것이 Data Discovery 도구이다. Data Discovery 도구는 최신 BI 트렌드로 2012년 가트너와 American information technology research 등을 통해 향후 BI가 추구해야 할 방향으로 소개되면서 주목 받기 시작했다.

Data Discovery 도구는 기존 BI 도구에 분석적인 개념을 추가한 것으로 기존 BI는 사전에 구축된 DW를 바탕으로 과거 데이터를 보여주는 방식이었다면, Data Discovery 도구에서는 분석 프로세스의 일부를 사용자가 직접 생성할 수 있으며, 통계 또는 데이터 마이닝 기법의 일부가 포함되어 있다. Data Discovery 도구는 BI 와 좀 더 가깝긴 하지만 BI와 고급 분석의 중간 정도의 형태를 띠고 있다고 표현 할 수 있을 것이다.

 

[내용 인용]: 엔코아 리포트 (http://www.dator.co.kr/bmonthly/1879742)


 

 

3. BI와 고급 분석 툴


그렇다면 (고급) 분석과 BI(Data Discovery 포함) 툴은 무수히 많은 툴과 업체가 존재한다. 고급 분석과 관련된 업체를 살펴보면 다음과 같은 Gartner 발표 자료를 참조 해 볼 수 있다.

 



그림 4. 고급분석 툴 및 업체 현황

리더 그룹을 살펴보면, SAS IBM, KNIME, 그리고 RapidMiner가 보인다. SAS는 언급할 필요도 없는 고급 분석 시장의 오랜 강자이다. IBM의 경우 고급 분석 업체인 SPSS를 인수하면서 IBM Modeler라는 분석 툴의 포트폴리오를 확장하고 있다. KNIME RapidMiner의 경우 SAS IBM에 비해 상대적으로 규모는 작지만 최근 분석 시장의 커지면서 미국에서 주목 받고 있는 고급 분석 툴이다.

위에는 표기 되지 않았지만 한 가지 더 언급하면 오픈 소스 ‘R’을 이야기 할 수 있다. 위 그림에 표시되어 있는 이름은 분석 툴을 제공하는 업체이다(오픈 소스 버전을 제공하기도 하지만 기업용 상용 버전을 제공). 하지만 ‘R’은 순수 오픈 소스로 상용버전을 판매하는 업체가 있기는 하지만 주로 오픈 소스 버전이 사용자 그룹을 이끌고 있어 기업용이라기 보다는 개인용으로 많이 사용되고 있다.

다음으로 BI 와 관련된 업체를 소개하면 다음과 같다.

BI 도구의 리더 그룹은 대체로 Global Major 업체들의 제품들이 많이 포함되어 있다. 하지만 그 중 Tableau, Qlik 등의 최근 급성장한 업체도 존재한다. Tableau의 경우 미국에서 가장 빠르게 성장한 BI 업체 중 하나이며, Qlik 역시 전통적인 BI가 아닌 새로운 형태를 제공함으로 빠르게 성장하고 있다. IBM SAP 역시 IBM Cognos, SAP Lumira 등과 같은 Data Discovery 제품을 제공하고 있다.




그림 5. BI 업체 현황

 

최근 분석 시장의 성장에 따라 수많은 분석 툴들이 나오고 있지만, 정말 선택해야 하는 것은 당신이 분석하고자 하는 목적이 우선이며, 그에 따른 적절한 분석 툴이어야 할 것이다.


[내용 인용]: 엔코아 리포트 (http://www.dator.co.kr/bmonthly/1879742)






Posted by Bitnine(비트나인)