Page 127 - 고등학교 인공지능 기초
P. 127

2     데이터 속성의 역할



                           데이터는 인공지능 학습에 사용되는 가장 중요한 자원이다. 인공지능을 만드

                         는 첫 단계는 데이터를 준비하는 것이다.
                           데이터의 모든 속성을 학습에 사용하는 것이 아니라, 필요한 속성만 골라 사
                         용한다. 예를 들어 어획 활동에 도움을 주기 위해 파고를 예측하는 인공지능을

                         만든다고 가정해 보자. 파고 를 예측하는 데 필요한 데이터 속성만 선택하여 학                                파고
                                                                                                   파도의 높이
                         습에 사용해야 한다. 날씨, 풍향, 풍속이 파고에 영향을 미치는 요인이라면 다
                         른 속성은 제외하고 해당 속성만 선택하여 학습에 활용한다.

                                                                                 데이터 속성
                                          데이터
                                                                           이게
                                                                        핵심 속성이야.   날씨                            예측
                             요일      날씨     풍향      풍속     파고
                                                                                   풍향                            파고
                             월요일   구름 많음    북동       7     0.5
                             화요일     맑음     북동      12     1.5.
                                                                                   풍속
                             수요일     흐림     남동      9      1.0                                     학습
                              …      …       …      …       …


                            그림Ⅲ-3 l 파고를 예측하는 데 필요한 속성


                           인공지능은 어떤 대상을 예측하거나 분류하는 데 사용된다. 이때 예측 및 분
                         류하려는 속성이 레이블이다. [그림 Ⅲ-3]에서는 파고가 레이블 속성이다.
                           인공지능 모델의 성능을 높이려면 레이블 속성을 예측하는 데 필요한 속성

                         만 학습 데이터로 선택해야 한다. 이러한 속성을 핵심 속성이라 한다. 파고 예측
                         인공지능에서는 날씨, 풍향, 풍속이 핵심 속성이고, 요일은 핵심 속성이 아니다.
                         특정 요일에만 파고가 높거나 낮지는 않기 때문이다. 이처럼 학습에 필요한 데

                         이터 속성만 골라내는 것을 핵심 속성 추출이라고 한다.




                            카드사에서 고객의 시간대별 카드 사용 패턴을 예측하는 인공지능을 만든다고
                            가정해 보자. 카드 사용 패턴과 관련 있는 속성이 카드 사용 일자, 시간, 사용처,
                            결제 금액이고, 관련 없는 속성이 거래 번호라면 4개의 속성만 학습에 활용한다.













                                                                                                                   125
                                                                                                      1. 데이터의 속성
   122   123   124   125   126   127   128   129   130   131   132