Page 103 - 고등학교 인공지능 기초
P. 103
2 기계학습의 유형
일반적으로 기계학습에 사용되는 학습 데이터는 입력 데이터와 정답 데이터 기계학습 유형
로 구성된다. 이때 정답 데이터를 레이블(label)이라 한다. 정답 데이터가 함께 기계학습
주어지는지 여부에 따라 지도학습과 비지도학습으로 분류할 수 있다. 지도학습 비지도학습
분류 회귀 군집화
❶ 지도학습
지도학습(supervised learning)은 입력 데이터와 정답 데이터를 바탕으로 학 입력 데이터 레이블
습을 진행하는 기계학습 방법이다. 즉, 데이터와 정답을 모두 알려주고 모델이
학습할 수 있도록 하는 것이다.
학습을 완료한 지도학습 모델
예측하려는 데이터
그림Ⅱ-38 l 지도학습 예시
예를 들어 강아지 사진과 고양이 사진을 입력 데이터로, ‘강아지’, ‘고양이’를
레이블로 주고 학습하도록 할 수 있다. 지도학습 모델은 이렇게 각 데이터의 패
턴을 레이블과 연관 지으며 학습한다. 위 모델에서 강아지 데이터의 패턴은 처
진 큰 귀와 까만 눈이 될 수 있고, 고양이 데이터의 패턴은 뾰족한 삼각 귀와 노
란 바탕의 눈이 될 수 있다. 모델이 학습을 완료한 후 새로운 데이터의 레이블을
분류할 수 있다.
사람이 다양한 문제를 풀어볼수록 정답을 맞힐 확률이 높아지는 것처럼 인
공지능도 다양한 데이터를 많이 학습할수록 더 정확하게 분류하고 예측한다.
그러나 아무리 많은 데이터로 충분히 학습했다 하더라도 레이블이 잘못되었다
면 올바른 학습 결과를 얻을 수 없다. 따라서 지도학습에서는 레이블을 정확하
게 다는 것이 매우 중요하다.
그림Ⅱ-39 l 레이블이 잘못된 데이터
101
6. 기계학습의 개념과 활용