Head First Data Analyst #5 가설 검정
각 변수의 상관 관계를 잘 알아야한다.
한 변수의 값이 오를 때, 다른 변수들에게 미치는 영향을 잘 분석해야한다.
변수는 음의 상관관계도 있고 양의 상관관계 또한 존재한다.
현실세계에서는 인과관계는 선형이 아니라 네트워크 형이다.
예를 들어, 핸드폰 회사가 신종 핸드폰을 출시하고 싶은데 출시일을 언제 할지 고민한다면,
여러 가설들을 세워본다. 가설을 세우고 검정 할 때, 만족화는 권장하지 않는다.
왜냐하면 사람들이 다른 대안을 충분히 분석하지 않고 가설을 선택할 경우 비록 그에 반하는 증거들이 수집되더라도 그 가설을 고수하게 된다.
그래서 가설 검정할 때에는 반증을 이용한다. 즉, 안되는 것을 지우고 마지막에 살아남는 가설을 선택하여 실험하는 것이다.
증거와 데이터가 가설의 상대적인 설득력을 평가하는 데 도움이 된다면 그것은 진단 가능성이 있다고 말한다.
한 변수의 값이 오를 때, 다른 변수들에게 미치는 영향을 잘 분석해야한다.
변수는 음의 상관관계도 있고 양의 상관관계 또한 존재한다.
현실세계에서는 인과관계는 선형이 아니라 네트워크 형이다.
예를 들어, 핸드폰 회사가 신종 핸드폰을 출시하고 싶은데 출시일을 언제 할지 고민한다면,
여러 가설들을 세워본다. 가설을 세우고 검정 할 때, 만족화는 권장하지 않는다.
왜냐하면 사람들이 다른 대안을 충분히 분석하지 않고 가설을 선택할 경우 비록 그에 반하는 증거들이 수집되더라도 그 가설을 고수하게 된다.
그래서 가설 검정할 때에는 반증을 이용한다. 즉, 안되는 것을 지우고 마지막에 살아남는 가설을 선택하여 실험하는 것이다.
증거와 데이터가 가설의 상대적인 설득력을 평가하는 데 도움이 된다면 그것은 진단 가능성이 있다고 말한다.
댓글
댓글 쓰기