Page 105 - 고등학교 인공지능 기초
P. 105

➋ 비지도학습
                           비지도학습(unsupervised learning)은 입력 데이터에 대한 레이블 없이 인공
                         지능이 학습을 진행하는 것이다. 정답에 대한 정보가 없는 데이터로부터 필요

                         한 패턴을 추출하여 데이터에 어떠한 특성이 있는지 알아낸다.
                           비지도학습의 대표적인 학습 방법은 군집화이다. 군집화(clustering)란 주어

                         진 데이터의 특성을 고려해 데이터 집단을 정의하고 데이터 집단을 대표할 수
                         있는 중심점을 찾는 것이다. 데이터의 특성이 다르면 다른 집단에 속하도록 학
                         습한다.





                                   나이                         나이








                                                연 지출액                      연 지출액
                                           ▲ 초기 상태              ▲ 임의의 군집 중심점 3개 설정




                                   나이                         나이

                                                                                                      군집화 과정
                                                                                                   군집화의 대표적인 알고리즘으로
                                                                                                   K-평균 군집화가 있다. K-평균
                                                                                                   군집화에서 군집화할 집단의 개수
                                                연 지출액                      연 지출액                   를 설정하면 해당 개수만큼의 중
                                                                                                   심점을 임의로 지정한다. 데이터
                                           ▲ 완료 상태           ▲ 군집 내 데이터의 평균으로 군집점 이동
                                                                                                   는 가장 가까운 중심점의 군집에
                                                                                                   속하게 되고, 군집 내 데이터의 평
                                                                                                   균값을 구하여 군집의 중심점이
                                              그림Ⅱ-42 l 나이와 연 지출액에 따른 고객 군집화 예시
                                                                                                   이동한다. 이러한 과정을 여러 번
                                                                                                   거쳐 군집화가 이루어진다.
                           예를 들면 나이와 연 지출액에 따른 영상 시청 데이터를 바탕으로 취향이 같

                         은 사람들끼리 집단을 묶어 영상을 추천해 주는 시스템에도 군집화를 적용할
                         수 있다. [그림Ⅱ-42]에서 첫 번째 그래프는 영상 시청 서비스 고객 데이터를 나
                         이와 연 지출액에 따라 나타낸 것이다. 군집화 과정을 거치며 데이터는 세 개

                         의 집단으로 나누어진다. 붉은색으로 표시된 집단은 나이대와 연 지출액이 모
                         두 높은 고객으로, 이 집단에 속한 고객의 영상 시청 패턴을 분석하면 맞춤 영
                         상 추천이 가능할 것이다.





                                                                                                                   103
                                                                                                 6. 기계학습의 개념과 활용
   100   101   102   103   104   105   106   107   108   109   110