머신러닝 다시 시작하기 - 1
머신러닝 다시 시작하기 - 1 머신러닝 다시 시작하기 - 1 앤드류 융 교수님 강의로 다시 머신러닝 공부해볼 계획이다. 우선 머신러닝에 대해 간단히 적어보겠다. 머신 러닝은 크게 아래와 같은 절차를 거친다. [모델링] 데이터를 보고 어떤 모델을 사용할 지 결정한다. [학습] 결정한 모델을 학습시킨다. [평가] 그 모델을 평가한다. 위의 절차는 머신러닝 전과정을 크게 본 것이다. 세부적으로 많은 절차들이 있다. 1번째 요약에서는 세부적인 절차는 다루지 않고 나중에 따로 다루도록 해야겠다. 1. 모델링 데이터를 보고 어떤 모델을 사용할 지 사용자가 결정하여 머신러닝을 시작한다. 머신러닝에 쓰이는 데이터에는 여러 종류가 있다. 크게 2개로 나눈다면, 정답이 있는 데이터와 정답이 없는 데이터로 나누고 싶다. 그에 따라 학습 방법론이 달라진다. 정답이 없는 데이터는 비지도 학습 에 쓰이고, 정답이 있는 데이터는 지도 학습 에 쓰인다. 굉장히 중요하다. X ( = F e a t u r e s ) → h ( θ ) ( = H y p o t h e s i s ) → Y ( = A n s w e r s ) X(=Features) \rightarrow h(\theta) (=Hypothesis) \rightarrow Y(=Answers) X ( = F e a t u r e s ) → h ( θ ) ( = H y p o t h e s i s ) → Y ( = A n s w e r s ) 베이스는 위와 같다. 정답인 Y와 내가 예상한 값 h를 비교하면서 θ \theta θ 를 조절하는 과정을 반복한다. 어떻게 반복되는 지는 나중에 더 자세하게 적도록 하겠다. 1-1) 지도 학습 지도 학습 은 정답(Label)이 있는 데이터를 학습시킬 때 사용된다. 크게 회귀(Regression)과 분류(Logistic Regression = Classification)로 나눌 수 있다. 1-1-1) 회귀(Linear...