Page 104 - 고등학교 인공지능 기초
P. 104
지도학습으로 해결할 수 있는 대표적인 문제에는 분류와 예측이 있다.
분류(classification)는 미리 정의되어 있는 범주 중 데이터가 어느 범주에 속
하는지 구별하는 것이다. 긍정·부정으로 분류하는 이진 분류 문제와 3가지 이
상으로 분류하는 다중 분류 문제가 있다. 스팸 메일과 정상 메일, 보행자 유무,
바이러스 감염 여부 등을 구분하는 것은 이진 분류 문제이고, 꽃의 품종, 과일
의 등급, 학점, 숫자 등을 분류하는 것은 다중 분류 문제이다.
스팸 메일
스팸 메일 분류 인공지능 메일 수신함
정상 메일
AI
스팸 메일 보관함
그림Ⅱ-40 l 스팸 메일 이진 분류 예시
예측 예측(regression)은 어떤 변수 의 변화에 따른 다른 변수의 변화 정도를 알아
예측은 두 가지 의미로 사용될 수
내는 것이다. 주당 운동 횟수, 규칙적 식사 여부 등 건강 데이터를 바탕으로 수
있다. 일반적으로 넓은 의미의 예
측(prediction)은 인공지능 모델이 명을 예측하고, 강우량 데이터에 따라 우산 판매량을 예측하는 문제를 예로 들
레이블을 모르는 데이터에 대하여
값을 추론하는 행위를 말한다. 수 있다. [그림Ⅱ-41]에 나타난 것처럼 강우량 변수와 우산 판매량 변수 간 상관
좁은 의미의 예측(regression)은
관계를 예측하는 선을 그려 데이터의 경향성 을 파악할 수 있다.
인공지능 회귀 모델이 어떤 변수
의 변화에 따른 다른 변수의 변화
정도를 추론하는 것을 말한다.
60
변수
50
변수란 프로그램 실행에 필요한 값
을 저장하기 위한 공간으로 숫자, 40
문자 등의 값을 저장할 수 있다. 예
를 들어 일별 강우량, 우산 판매량 우산 판매량 30
등이 변수로 저장될 수 있다. 20
경향성 10
현상이나 사상, 행동 따위가 어떤
방향으로 기울어지거나 쏠리는 성 0
5 10 15 20 25 30
향을 말한다.
강우량(mm)
그림Ⅱ-41 l 강우량에 따른 우산 판매량 예측 예시
102 Ⅱ 인공지능의 원리와 활용