Head First Data Analyst #1 잘게 쪼개라

정의 -> 분해 -> 평가 -> 결정

1. 정의

문제를 정의한다. 고객은 문제를 정의하는 데 도움이 된다.
고객에 대해 잘 알아야한다. 
고객의 데이터에 대한 신뢰도, 성격, 사업 스타일 등 고객에 대해 많이 알 수록 
만족도를 높일 수 있다.

2. 분해

문제를 분할.
만약 고객이 매출을 늘리기 원한다면, 이 요구에서 여러 가지 분해 할 수 있다.
광고는 어떻게 되어 있는가? , 어떤 프로모션이 가장 효과적인가 등 위 요구에서 
많은 걸 분해해서 뽑아 내야한다.

데이터를 분할.
원시 데이터를 받았다면 요약하여 변수간의 상관관계, 변수값의 상승,하강 등 
데이터에 대해 많은 걸 뽑아내야한다.

아는 것도 관점을 달리해서 본다.
가장 중요한 요소를 추출하기 위한 최적의 방법은 강한 대조를 찾아내는 것.

3. 평가

문제에 대한 관찰과 데이터에 대한 관찰로 나누어 생각.
문제에 대한 관찰로는 제품에 대한 고객층, 경쟁사 견제, 마케팅 등
데이터에 대한 관찰로는 데이터 자체를 요약하고 비교/대조.

분석은 자신을 포함시키는 것에서 시작.
-> 자신의 가정을 명시적으로 밝히고, 결론에 대해 확신을 가진다.

4. 결정

권고안을 제출. 분석 결과는 간결하게 정리되어 제출되어야 한다. 
좋은 프레젠테이션은 필수적 요소.

권고안의 분석이 잘못되어 원하는 결과를 못 얻을 시, 다시 정의 단계로 돌아가
다른 시각으로 데이터를 분석해야한다.
예를 들어, 데이터 중 유통업체에 대한 것이 있다면, 유통업체를 통해 제품이 어떤 고객층에게 팔리는지 새로운 고객층은 없는지에 대해 조사.

댓글

이 블로그의 인기 게시물

윈도우 설치에서 파티션 설정 오류(NTFS)

[exploit writing] 1_스택 기반 오버플로우 (1) First

하둡 설치 오류 정리