Page 172 - 고등학교 인공지능 기초
P. 172

5    모델 성능 평가



                      성능 평가 지표                 훈련 데이터를 사용해 학습을 마친 모델은 테스트 데이터를 이용해 결과를
                    성능 평가를 위한 지표 중 정확도
                                             검증하고 성능을 평가해야 한다.
                    와는 달리 전체 데이터 중에서 잘
                    못 분류한 비율을 나타내는 에러율         모델의 성능은 다양한 지표를 통해 평가할 수 있다. 분류 모델의 성능을 평가
                    (Error Rate)도 있으며 그 외에도 민
                    감도(Sensitivity), 정밀성(Precision)   하는 가장 대표적인 지표는 정확도이다. 정확도(accuracy)는 테스트 데이터를
                    등이 있다.
                                             얼마나 정확하게 분류했는지를 나타내는 지표이다. 즉, 전체 테스트 데이터의
                                             샘플 중에서 정답인 결과의 비율이다. 정확도는 테스트 데이터의 샘플 수에 따

                                             라 달라질 수 있으며, 샘플 수가 같더라도 핵심 속성의 값이 다르면 달라질 수
                                             있다.



                                                                      레이블과 비교하여 정답인 결과
                                                             정확도 =                           ×100
                                                                      테스트 테이터의 전체 샘플 수


                                               다음은 학습한 분류 모델로 테스트 데이터를 분류한 예이다. 10번의 테스트

                                             중에서 9번 맞았으므로 정확도는 90%이다.


                                                               이름       당도      아삭함      종류        종류
                                                               참외        8       7       과일        과일
                                                               소세지       2       4      단백질       단백질
                                                               수박        9       7       과일        과일
                                                               양파        5       8       채소        채소
                                                       오답      배추        2       5       채소       단백질
                                                               멜론        9       2       과일        과일
                                                               양배추       4       7       채소        채소
                                                                감        7       8       과일        과일
                                                              닭가슴살       5       5      단백질       단백질
                                                              삶은 계란      3       3      단백질       단백질

                                                               그림Ⅲ-33 l 테스트 데이터를 통한 성능 평가



                                                                             9
                                                                    정확도 =        ×100 = 90%
                                                                             10










                    170    Ⅲ 데이터와 기계학습
   167   168   169   170   171   172   173   174   175   176   177