그래프 FDS 소개
G-FDS는 그래프 기술(Graph Technology)을 기반으로 한 이상행위탐지시스템(FDS)입니다. 모든 데이터 간의 관계를 연결해 전체적인 흐름에서의 탐지 환경을 제공하며, 기존 FDS에서는 활용하지 않았던 ‘관계’ 기반의 데이터를 활용해 알기 어려운 복잡한 관계 속에서의 범죄 행위를 추적하거나 숨겨진 흔적 및 패턴들을 도출해낼 수 있습니다.
대포통장, 카드위조, 보험사기 등의 금융 범죄와 부정수급, 조세포탈과 같은 조세 범죄에 대한 탐지 및 추적에 활용되며, ‘파나마 페이퍼스’ 조세회피 혐의 적발 사례가 가장 대표적인 사례로 꼽힙니다.
본 글은 비트나인의 신제품, 아젠스그래프 기반의 G-FDS를 소개하고자 합니다. 그리고 G-FDS가 타 FDS와 다르다는 점을 알리기 위해 적용된 모티프 분석 FDS 엔진을 설명한 후, G-FDS가 탐지할 수 있는 영역과 실제 사례로 마무리를 하고자 합니다.
왜 G-FDS인가?
G-FDS는 기존의 FDS가 탐지하지 못하는 영역을 AI 기반의 ‘그래프’로 탐지합니다. 다음 그림을 통해 룰 기반의 탐지 방식을 가진 일반적인 FDS와 비교하고자 합니다.
규칙 기반 (Rule-Based)
데이터 객체의 패턴을 정형화한 뒤, 이를 기반으로 정상 거래와 이상 거래를 판별하고 탐지합니다. 정해진 규칙을 바탕으로 이상 행위를 쉽게 탐지할 수 있고, 대상이 명확하기 때문에 간단한 연산으로도 탐지할 수 있으나, 룰 이외의 영역은 탐지하지 못합니다.
그래프 기반 (Graph-Based)
정형화된 패턴 외 비정형 데이터까지 고도화된 그래프 알고리즘을 통해 탐지합니다. 모티프 분석(Motifs Analysis) 기법에 의해 학습한 모든 패턴을 바탕으로 이상 행위를 탐지하기 때문에 기존 룰에서 벗어난 부분까지 탐지가 가능합니다.
G-FDS의 개념과 작동 원리
G-FDS는 관계성이 존재하는 데이터에서 수많은 트랜잭션(Transaction)을 누적 시켜 형성된 복잡한 네트워크에서 패턴의 빈도와 숨겨진 관계를 분석해 이상 거래를 탐지합니다. 모티프 분석을 통한 그래프 알고리즘 적용 프로세스는 다음과 같습니다.
모티프(Motif)는 일정한 수의 노드(Node)로 만들어낼 수 있는 가설 패턴들(M1, M2, M3..)에 대한 정의이며, 서브그래프(Subgraph)라고도 불립니다. 예를 들어, ‘A가 B에게 이체하고, B가 C에게 이체했다’라는 하나의 가설 패턴이 모티프가 되는 것입니다.
수집된 정상 행위와 이상 행위의 패턴을 놓고, 일치하는 가설 패턴을 찾아냅니다. 이 가설 패턴이 실존하는 경우에는 모티프 지문(Motif Fingerprint)으로 지칭하고, 전체 패턴 중 모티프 지문의 반복 횟수를 통계합니다. (예: M4 = 24회 반복)
모티프 지문의 수를 수집해 이상 행위의 패턴별 빈도를 알기 위한 점수를 도출합니다. 이때 통계학적인 정규분포를 만들어 점수를 부여하게 되는데, 이를 Z 점수(표준 점수)라고 합니다. 이 Z 점수를 기반으로 이상 행위와 정상 행위에서 자주 나타나는 패턴을 나열해 그 차이를 비교하고, 그중 빈도의 차이가 큰 모티프 지문을 발견하면 이를 의심 패턴으로 지정합니다. (다만, 정상 행위 빈도수가 높고 이상 행위가 존재하지 않는 경우의 모티프라면, 의심 대상으로 지정할 수 없음). 이 의심 패턴의 데이터는 곧 범죄유형의 샘플 데이터로 볼 수 있으며, 이 데이터를 누적 시켜 향후의 이상 행위 및 범죄의 적발에 활용하게 됩니다.
G-FDS로 어디까지 잡아낼까?
G-FDS가 범죄를 탐지할 수 있는 영역은 크게 3가지로 나뉩니다.
전자 금융 분야
-
대포통장: 범죄 수익을 은닉하기 위해 제삼자의 명의를 도용한 대포통장을 추적 및 탐지할 수 있습니다.
-
카드위조: 타인의 신용카드를 위조, 복제해 결제하는 범죄 내역 및 위치를 추적할 수 있습니다.
-
보험사기: 보험금을 부당하게 청구, 수령하기 위해 가해자와 피해자가 공모한 범죄를 탐지할 수 있습니다.
공공 분야
-
조세포탈/자금세탁: 소득/거래의 조작과 은폐, 문서 조작/파기, 재산 은닉 등 개인/법인 탈세 범죄를 탐지할 수 있습니다.
-
부정수급/환급: 허위 신고로 세금 환급 및 지원금 등 공공 재정을 부정으로 받는 범죄를 탐지할 수 있습니다.
-
밀수범죄: 범죄자가 공모자의 명의를 이용해 밀수품, 마약 등을 대리 반입하는 범죄를 탐지할 수 있습니다.
전자통신 분야
-
e-커머스: 고객 계정 도용, 상품정보 유출 및 부정 거래, 해킹 등 전자상거래 환경의 범죄를 탐지할 수 있습니다.
-
가짜뉴스: SNS상에서 무분별하게 확산하는 가짜뉴스의 패턴을 구분하고 분류해 허위 사실을 탐지할 수 있습니다.
-
피싱/스미싱: 금융기관을 가장한 전화, 문자 등으로 개인 정보를 빼내는 사기 범죄를 탐지할 수 있습니다.
위 영역을 포함하여 비트나인은 G-FDS를 전자 금융 영역에 성공적으로 구현한 바 있습니다. 아래 각 사례에 대한 요약과 링크가 있으니, 참고 부탁드립니다.
Case 1: 보험사기 적발
인위적인 사고를 일으켜 부당하게 보험금을 청고한 보험사기의 적발 사례로, 대부분 보험가입자(가해자, 피해자)와 서비스 제공업자(의사, 정비업자) 간의 복잡한 연관 관계로 얽혀 있습니다. 그래프 관계 모델링을 활용하면 사건 관계자들 간 공모 관계를 파악해 유사한 패턴의 사고까지 확인할 수 있습니다. 숨겨져 있던 복잡한 관계를 직관적으로 파악할 수 있으며, 과거의 전적을 바탕으로 의심 관계를 찾아 새로운 관계로 확장할 수도 있습니다.
Case 2: 대포통장 적발
타인의 명의를 도용해 만든 통장으로 부당한 범죄이익을 얻는 사기 범죄의 적발 사례입니다. 의심 계좌와 그 계좌를 둘러싼 수많은 거래처, 각종 접속, 인증 정보 등을 그래프로 연결해 그 데이터 간의 숨겨진 관계를 찾아낼 수 있습니다. 과거 금융사기 범죄 이력이 존재하는 대포통장의 패턴(Motif-Fingerprint)을 바탕으로 그와 연결된 추가적인 의심 계좌의 탐지까지 가능하며, 그래프 간 관계를 시각화해 실시간 모니터링까지 용이하게 할 수 있습니다.
범죄의 징후, 그래프로 연결하라!
G-FDS는 그래프 분석이 가능한 형태로의 모델링 서비스를 제공합니다. 또한, ETL 서비스가 신규 데이터 생성 및 기존 데이터 이관을 용이하게 해주기 때문에 기존 FDS에 사용하던 데이터를 어려움 없이 활용할 수 있습니다.
G-FDS는 기존 규칙에서 벗어난 영역까지 모두 탐지할 수 있으며, 데이터 수집과 분석에 최적화된 그래프 DB와 예측 가능한 AI 기술의 강점이 융합되어 범죄와 부정행위에 대한 선제 대응이 가능합니다. 그래프 기술을 활용한 FDS는 금융권, 보험사, 공공 행정, 제조 서비스 분야 등 사회 전반적으로 부정행위의 수준이 날로 지능화되는 시점에서 새로운 대안이 될 것입니다.
멀티모델 그래프데이터베이스 AgensGraph
60일간 무료로 사용해 보세요
bitnine.net/agensgraph-downloads/
제품 및 기술문의
070-4800-3517 | agens@bitnine.net
'GRAPH DB > Graph Solution' 카테고리의 다른 글
그래프 기반 추천 시스템이란? (0) | 2022.03.21 |
---|---|
G-PAS 실전편 2부: 회귀와 분류로 알아보는 지도 학습 (0) | 2022.02.25 |
G-PAS 실전편 1부: 관계형 데이터를 그래프 데이터로 변환하는 방법 (0) | 2022.02.22 |
G-PAS 이론편: 그래프 DB를 활용한 예측 분석 (0) | 2022.02.14 |
G-PAS, 빅데이터 예측분석 시스템 (0) | 2020.12.21 |