RESEARCH & REPORT/그래프 기술

GDB를 활용한 FDS 데이터 모델링 및 방법론

(주)비트나인 2023. 9. 3. 15:13

Introduction

 본 글에서는 Fraud Detection System (FDS)에서의 그래프 데이터베이스를 활용한 데이터 모델링과 방법론에 대해 자세히 살펴보겠습니다. FDS는 이상거래 및 사기 탐지 시스템으로, 기존의 미리 정의된 규칙(Rule)을 사용하여 실시간으로 데이터를 탐지합니다. 하지만 그래프 데이터베이스의 도입을 통해 어떤 가치가 더해질 수 있는지 살펴보고, 실제로 어떻게 데이터 모델링과 방법론이 적용되는지 알아보겠습니다.

FDS의 데이터와 그래프 모델링

 FDS에서 주로 사용되는 데이터는 거래 정보와 사용자 정보 등 다양한 데이터로 구성됩니다. 기존의 FDS는 거래 데이터를 실시간으로 분석하여 정의된 규칙에 따라 이상 거래를 탐지하는 방식을 채택했습니다. 그러나 이러한 방식은 규칙의 한계로 인해 새로운 이상 패턴을 탐지하기 어렵다는 단점이 있었습니다.

 

그래프 데이터베이스를 도입함으로써, 데이터 간의 '연결'을 표현하는데 더 적합한 접근 방식을 사용할 수 있습니다. 그래프 모델링을 활용하면 모든 거래 및 액션들을 연결하여 더 정교한 데이터 모델을 구축할 수 있습니다. 이러한 모델링 방식을 통해 새로운 패턴과 관계를 발견하고, 이상 행위를 더 효과적으로 탐지할 수 있습니다.

 

그래프 모델링 방법론

FDS에서는 주로 두 가지 그래프 모델링 방법을 사용하며, 이 두 가지 방법을 조합하여 사용하기도 합니다.

1. 거래 행위 및 흐름을 단일 그래프로 모델링하기

이상거래 및 사기 행위는 자취(Trace)를 남기게 됩니다. 이러한 자취에 대해 시간과 거래 정보를 edge에 모델링한다면, 단순히 이상거래에 대한 거래금액의 패턴뿐 아니라 거래의 흐름과 이상계좌와의 거래 관계를 고려한 탐지 모델을 생성할 수 있습니다.

 

[ 그림 1. 계좌간 거래행위 기반으로 그래프 모델링을 한 예시 ]

 

2. 이기종 네트워크 모델링

이기종 그래프 모델링시 얻을 수 있는 효과는 단일 그래프에서 서로 연결되지 않아서 찾기 어려운 관계를 공통된 추가 정보를 통해 연결관계를 도출 해낼 수 있다는 점입니다. 이기종 네트워크 모델링은 '한 다리 건너면 연결되는 관계'를 활용하여 그래프의 점과 선에 의해 순환 고리 형태로 데이터 구조를 저장합니다.

[ 그림2 . 계좌의 휴대폰 및 거래처 기반으로 이기종에 대한 추가 그래프 모델링을 한 예시 ]

    

 

그래프 데이터베이스의 가치와 활용

FDS에서 그래프 모델링을 통해 얻어지는 가치는 다음과 같습니다.

1. 거래 행위에 대한 패턴 도출

그래프 데이터베이스를 활용한 FDS는 거래의 흐름과 이상 계좌와의 거래 관계를 고려하여 새로운 거래 행위 패턴을 도출할 수 있습니다. 예를 들어, 기존의 FDS는 단순히 이상 거래 금액의 패턴만을 확인하는데 그치지만, 그래프 모델링을 통해 연속적인 거래 행위를 시간적으로 관계를 고려하여 분석할 수 있습니다. 이를 통해 사기거래의 특징적인 행동 패턴을 파악하고, 이를 기반으로 새로운 이상 거래 패턴을 정의할 수 있습니다.

2. 이상행위에 대한 데이터 탐색

그래프 데이터베이스를 활용한 FDS에서는 그래프의 점과 선으로 거래행위와 이상행위를 모델링하여 데이터를 효율적으로 탐지하고 활용할 수 있습니다. 예를 들어, 특정 사용자가 여러 개의 계좌를 이용하여 이상 거래를 시도하는 경우를 그래프로 표현할 수 있습니다. 이를 통해 이상 행위에 대한 다양한 관계를 파악하고, 빠르게 탐지하고 대응할 수 있습니다.

3. 순환고리 패턴 (Fraud Rings)

그래프 모델링을 통해 얻은 순환고리 패턴은 FDS에서만 활용할 수 있는 강점입니다. 순환고리 패턴은 이기종 그래프를 모델링하면서 생기는 패턴으로, 한다리 건너서 관계를 맺게 되면 결국 그래프의 점과 선에 의해 순환 고리 형태로 데이터 구조가 저장됩니다. 이러한 패턴은 사기 행위를 도출하고, 이와 관련된 다른 계좌나 사용자들을 파악하는데 도움을 줄 수 있습니다.

4. 투영(Projection)의 활용

이기종 그래프 모델링을 통해 얻은 관계를 단일 그래프로 변환하는 방법인 '그래프 투영'은 새로운 관계들을 도출하는데 활용됩니다. 예를 들어, 휴대폰 번호나 거래처와 같은 이기종 데이터를 그래프에 연결함으로써, 이기종 관계를 갖는 데이터들을 단일 그래프로 변환할 수 있습니다. 이를 기반으로 새로운 관계를 파악하고, 더 정교한 분석을 시도할 수 있습니다.

예시

예를 들어, 그래프 데이터베이스를 활용한 FDS에서 한 사용자가 여러 개의 은행 계좌를 이용하여 이상한 시간대에 많은 금액의 거래를 진행하는 이상 행위를 탐지합니다. 또한 그래프 데이터베이스를 이용하여 특정 사용자가 다른 사용자와 네트워크를 형성하고, 이러한 네트워크를 통해 대량의 자금을 이체하는 사기 거래를 파악합니다. 이러한 패턴들은 기존의 FDS 방식으로는 감지하기 어려웠던 이상 행위들을 빠르고 효과적으로 탐지하고 대응할 수 있도록 도와줍니다.

 

결론

그래프 데이터베이스를 활용한 FDS는 다양한 관계와 패턴을 고려하여 데이터를 모델링하고 분석함으로써, 기존의 FDS 시스템에 비해 보다 정교하고 효과적인 사기 탐지를 가능케 합니다. 거래 행위와 이상 계좌의 연결, 순환고리 패턴 및 투영 등의 활용으로 새로운 시각과 방법론을 도입하여 FDS의 성능을 더욱 향상할 수 있습니다. 이를 통해 금융 기관은 더욱 안전하고 신뢰성 있는 거래 환경을 제공할 수 있을 것입니다.

 

 

 

글 : 정두희 책임 ( 비트나인 서비스분석팀 )