Page 172 - 고등학교 인공지능 기초
P. 172
5 모델 성능 평가
성능 평가 지표 훈련 데이터를 사용해 학습을 마친 모델은 테스트 데이터를 이용해 결과를
성능 평가를 위한 지표 중 정확도
검증하고 성능을 평가해야 한다.
와는 달리 전체 데이터 중에서 잘
못 분류한 비율을 나타내는 에러율 모델의 성능은 다양한 지표를 통해 평가할 수 있다. 분류 모델의 성능을 평가
(Error Rate)도 있으며 그 외에도 민
감도(Sensitivity), 정밀성(Precision) 하는 가장 대표적인 지표는 정확도이다. 정확도(accuracy)는 테스트 데이터를
등이 있다.
얼마나 정확하게 분류했는지를 나타내는 지표이다. 즉, 전체 테스트 데이터의
샘플 중에서 정답인 결과의 비율이다. 정확도는 테스트 데이터의 샘플 수에 따
라 달라질 수 있으며, 샘플 수가 같더라도 핵심 속성의 값이 다르면 달라질 수
있다.
레이블과 비교하여 정답인 결과
정확도 = ×100
테스트 테이터의 전체 샘플 수
다음은 학습한 분류 모델로 테스트 데이터를 분류한 예이다. 10번의 테스트
중에서 9번 맞았으므로 정확도는 90%이다.
이름 당도 아삭함 종류 종류
참외 8 7 과일 과일
소세지 2 4 단백질 단백질
수박 9 7 과일 과일
양파 5 8 채소 채소
오답 배추 2 5 채소 단백질
멜론 9 2 과일 과일
양배추 4 7 채소 채소
감 7 8 과일 과일
닭가슴살 5 5 단백질 단백질
삶은 계란 3 3 단백질 단백질
그림Ⅲ-33 l 테스트 데이터를 통한 성능 평가
9
정확도 = ×100 = 90%
10
170 Ⅲ 데이터와 기계학습