Page 169 - 고등학교 인공지능 기초
P. 169
2. 분류 알고리즘 알고리즘의 종류
K -최근접 이웃(K -N N :
분류 모델에 사용할 수 있는 알고리즘에는 여러 종류가 있지만 여기서는 새 K-Nearest Neighbor) 알고리즘
로운 샘플의 이웃을 조사하여 분류하는 K-최근접 이웃 알고리즘을 사용하기로 외에 데이터의 패턴을 예측 가능
한 규칙의 조합으로 나타내는 의
한다. K-최근접 이웃 알고리즘은 미리 정한 개수만큼의 이웃이 얼마나 가까이 사 결정 트리(Decision Tree), 확
률을 계산하는 나이브 베이즈
있는지 조사하여 다수결로 분류한다. [그림Ⅲ-29]는 이웃 개수를 3으로 설정한
(Naive Bayes), 분류를 위한 경계
경우이다. 3개의 이웃이 모두 동일한 레이블이라면 쉽게 결정되지만, 그림처 선을 정의하는 서포트 벡터 머신
(SVM: Support Vector Machine)
럼 ▲가 2개, ■가 1개라면 다수결에 의해 ▲로 결정된다. 그러나 이 경우 이웃 등이 있다.
개수를 5로 변경하면 ■의 개수가 3이 되어 ▲보다 많아지므로 ■로 결정된다.
동률의 수를 피하기 위해 이웃의 수는 홀수를 선택하는 것이 좋다. 이처럼 이웃
을 몇 개 조사하는지에 따라 분류가 달라질 수 있으므로, 가장 정확하게 분류하
는 이웃의 수를 정하는 것이 중요하다.
●는 다수결에 의해
▲로 결정됨
범위가 넓어지면 ▒ 선택
? 이웃의 수 분류 모델 결과
3 ▲
5 ■
7 ▲
그림Ⅲ-29 l K-최근접 이웃 알고리즘의 원리
잠깐 활동
핵심 속성을 선택하지 않고 전체 데이터로 훈련하거나 핵심 속성이 아닌 데이터로 훈련하면 어떤 결과로 이어질 것인지 예
상하고, 왜 그렇게 예상했는지 설명해 보자.
167
4. 기계학습 모델 구현