Page 105 - 고등학교 인공지능 기초
P. 105
➋ 비지도학습
비지도학습(unsupervised learning)은 입력 데이터에 대한 레이블 없이 인공
지능이 학습을 진행하는 것이다. 정답에 대한 정보가 없는 데이터로부터 필요
한 패턴을 추출하여 데이터에 어떠한 특성이 있는지 알아낸다.
비지도학습의 대표적인 학습 방법은 군집화이다. 군집화(clustering)란 주어
진 데이터의 특성을 고려해 데이터 집단을 정의하고 데이터 집단을 대표할 수
있는 중심점을 찾는 것이다. 데이터의 특성이 다르면 다른 집단에 속하도록 학
습한다.
나이 나이
연 지출액 연 지출액
▲ 초기 상태 ▲ 임의의 군집 중심점 3개 설정
나이 나이
군집화 과정
군집화의 대표적인 알고리즘으로
K-평균 군집화가 있다. K-평균
군집화에서 군집화할 집단의 개수
연 지출액 연 지출액 를 설정하면 해당 개수만큼의 중
심점을 임의로 지정한다. 데이터
▲ 완료 상태 ▲ 군집 내 데이터의 평균으로 군집점 이동
는 가장 가까운 중심점의 군집에
속하게 되고, 군집 내 데이터의 평
균값을 구하여 군집의 중심점이
그림Ⅱ-42 l 나이와 연 지출액에 따른 고객 군집화 예시
이동한다. 이러한 과정을 여러 번
거쳐 군집화가 이루어진다.
예를 들면 나이와 연 지출액에 따른 영상 시청 데이터를 바탕으로 취향이 같
은 사람들끼리 집단을 묶어 영상을 추천해 주는 시스템에도 군집화를 적용할
수 있다. [그림Ⅱ-42]에서 첫 번째 그래프는 영상 시청 서비스 고객 데이터를 나
이와 연 지출액에 따라 나타낸 것이다. 군집화 과정을 거치며 데이터는 세 개
의 집단으로 나누어진다. 붉은색으로 표시된 집단은 나이대와 연 지출액이 모
두 높은 고객으로, 이 집단에 속한 고객의 영상 시청 패턴을 분석하면 맞춤 영
상 추천이 가능할 것이다.
103
6. 기계학습의 개념과 활용