Machine Learning in Action ch.12.1 & 12.2 FP-Growth Algorithm

이 알고리즘은 11절에 한 알고리즘의 연장선이다.
그래서 빈발 아이템 집합을 찾는다는 목적은 같다.
하지만 속도가 더 빠른 알고리즘이다.

크게 기본적인 2단계로 이루어진다.

1. FP-TREE 구축
2. FP-TREE를 이용해 빈발 아이템 집합 마이닝



12.1 FP-TREE 구축

트리를 구축하기 위해서 원본 데이터 집합을 두 번 살펴본다.

1. 모든 아이템의 빈도를 계산
2. 빈발 아이템에만 접근하여 계산

지지도를 계산하여 임계 값 이하로 발생항 아이템은 빈발하지 않은 아이템으로 간주한다.

FP-TREE 구축에 필요한 코드들은 스킵하겠다.


12.2 FP-TREE로 빈발 아이템 집합 마이닝하기

기본적인 3단계가 필요하다.

1. 트리로부터 기본 패턴 조건들을 구한다.
2. 기본 패턴 조건을 가지고 트리 조건을 구축한다.
3. 트리가 하나의 아이템만을 포함할 때까지 1단계와 2단계를 재귀적으로 반복한다.

알고리즘은 그냥 어떤 것인지 알아보고 넘어가는 식으로 공부하기 때문에 자세한 내용은 적지 않는다.

나중에 내 일과를 분석할 때, 나이브 베이즈와 FP성장 알고리즘을 잘 이용하면 더 좋은 결과를 낼 것 같다.

















댓글

이 블로그의 인기 게시물

윈도우 설치에서 파티션 설정 오류(NTFS)

[exploit writing] 1_스택 기반 오버플로우 (1) First

하둡 설치 오류 정리