Machine Learning in Action ch.1 Intro

다시 머신 러닝 공부를 시작하려 한다. 
O'REILLY 의 파이썬 데이터 분석 책은 흠.. 그냥 파이썬으로 데이터 프레임 다루는 거랑
pandas의 여러가지 기능들을 소개해놓은 느낌인데
머신 러닝 인 액션에서는 머신 러닝 알고리즘에 대해 하나씩 설명되어 있다.
전자의 책 먼저 하고 후자의 책을 학습하려다가 
너무 지루해서 그냥 병행하기로 했다.
두 책 모두 파이썬이라 너무 다행이긴 하다..
그 전에 썼던 글이랑 중복되는 게 많다..
----------------------------------------------------------------------------------------------

올바른 알고리즘 선정 방법

지도학습 방법

분류  :  회귀
K-NN :  선형 회귀
나이브 베이스 : 지역적 가중치가 부여된 선형 회귀
지지 벡터 머신 : 리지
의사결정 트리 : 라쏘

비지도학습 방법

군집화  : 밀도 추정
k-평균 : 기대 극대화
디비스캔 : 파젠 윈도우

위와 같이 이 책에서는 8가지의 알고리즘을 설명하고 있다.
어떤 데이터를 끌어 왔을 때, 그 데이터의 상황에 맞게 알고리즘을 선정해야한다.

목적 값을 예측하거나 예견하려고 한다면 지도학습 방법을 살펴보고, 그렇지 않다면 비지도 학습 방법을 살펴보라.

예를 들면, 목접 값이 예/아니오, 1/2/3, A/B/C 와 같이 이산적인 값이면 분류 방법을 살펴보고 수치 값이라면 회귀를 살펴봐야한다.

그리고 목적 값이 아닌 무리에 알맞은지를 알아보고자 하는 것이라면 군집화를 살펴봐야한다.

솔직히 위의 8가지 알고리즘 중 2가지는 처음 들어봤다. 이제 시작이니 각 장에서 하나하나 제대로 살펴보고 공부해야겠다.

댓글

이 블로그의 인기 게시물

윈도우 설치에서 파티션 설정 오류(NTFS)

[exploit writing] 1_스택 기반 오버플로우 (1) First

하둡 설치 오류 정리