Page 169 - 고등학교 인공지능 기초
P. 169

2. 분류 알고리즘                                                                   알고리즘의 종류
                                                                                                   K -최근접  이웃(K -N N :
                           분류 모델에 사용할 수 있는 알고리즘에는 여러 종류가 있지만 여기서는 새                                K-Nearest Neighbor) 알고리즘

                         로운 샘플의 이웃을 조사하여 분류하는 K-최근접 이웃 알고리즘을 사용하기로                                 외에 데이터의 패턴을 예측 가능
                                                                                                   한 규칙의 조합으로 나타내는 의
                         한다. K-최근접 이웃 알고리즘은 미리 정한 개수만큼의 이웃이 얼마나 가까이                                사 결정 트리(Decision Tree), 확
                                                                                                   률을  계산하는  나이브  베이즈
                         있는지 조사하여 다수결로 분류한다. [그림Ⅲ-29]는 이웃 개수를 3으로 설정한
                                                                                                   (Naive Bayes), 분류를 위한 경계
                         경우이다. 3개의 이웃이 모두 동일한 레이블이라면 쉽게 결정되지만, 그림처                                 선을 정의하는 서포트 벡터 머신
                                                                                                   (SVM: Support Vector Machine)
                         럼 ▲가 2개, ■가 1개라면 다수결에 의해 ▲로 결정된다. 그러나 이 경우 이웃                             등이 있다.

                         개수를 5로 변경하면 ■의 개수가 3이 되어 ▲보다 많아지므로 ■로 결정된다.
                         동률의 수를 피하기 위해 이웃의 수는 홀수를 선택하는 것이 좋다. 이처럼 이웃
                         을 몇 개 조사하는지에 따라 분류가 달라질 수 있으므로, 가장 정확하게 분류하

                         는 이웃의 수를 정하는 것이 중요하다.



                                                                     ●는 다수결에 의해
                                                                        ▲로 결정됨
                                                                    범위가 넓어지면 ▒ 선택

                                         ?                         이웃의 수     분류 모델 결과
                                                                      3         ▲
                                                                      5         ■
                                                                      7         ▲


                                                              그림Ⅲ-29 l K-최근접 이웃 알고리즘의 원리

                                                                                                       잠깐 활동

                             핵심 속성을 선택하지 않고 전체 데이터로 훈련하거나 핵심 속성이 아닌 데이터로 훈련하면 어떤 결과로 이어질 것인지 예
                             상하고, 왜 그렇게 예상했는지 설명해 보자.



























                                                                                                                   167
                                                                                                   4. 기계학습 모델 구현
   164   165   166   167   168   169   170   171   172   173   174