Head First Data Analyst #4 데이터 시각화

데이터의 품질과 그 해석에 관심이 있기 때문에 해석에 관한 여러분의 판단을 방해하는 
화려한 디자인은 불필요하다.


데이터가 너무 많다고 당황할 필요없다.
쓸모없는 데이터는 모두 무시하고 필요한 데이터만 뽑아서 분석하자.


데이터 시각화란 적절한 비교를 말한다.

뛰어난 시각화는 데이터를 나타내고 적절한 비교를 하며 여러 변수를 나타내야한다.


산포도를 이용해 원인을 찾을 수 있다.
산포도는 탐색적 데이터 부석을 위한 도구이다. 또한 인과관계를 나타낼때 쓰인다.
보통 x축은 독립변수를 나타내고, y축은 종속변수를 나타낸다.

댓글

이 블로그의 인기 게시물

윈도우 설치에서 파티션 설정 오류(NTFS)

[exploit writing] 1_스택 기반 오버플로우 (1) First

하둡 설치 오류 정리