Page 128 - 고등학교 인공지능 기초
P. 128

3    데이터 시각화를 이용한 핵심 속성 추출




                            학생들의 식사량을
                                                          그런데
                           미리 예측할 수 있다면               어떤 데이터 속성이    학교 영양사 선생님이 급식 때 음식물 쓰레기가 너무
                          음식물 쓰레기를 줄일 수 있지               필요하지?      많이 나와 고민이다. 그래서 학생들의 식사량을 예측
                                않을까?
                                                                    하여 적정량의 음식만 만들어 음식물 쓰레기를 최소
                                                                    화하기로 했다고 하자. 학생들의 식사량을 예측하려면
                                                                    어떤 데이터 속성이 필요할까?












                                               학생들의 식사량을 예측하려면 식사량과 관련된 핵심 속성을 추출해야 한다.

                                             이때 데이터를 시각화하면 핵심 속성을 쉽게 추출할 수 있다.
                                               데이터 시각화란 숫자나 문자 등으로 흩어져 있는 데이터를 한눈에 식별할

                                             수 있도록 만드는 작업이다. 데이터를 그래프로 표현하는 것을 시각화한다고
                                             말한다. 데이터를 시각화하면 속성 간의 상관관계를 파악하기 쉽다. [그림 Ⅲ-4]
                                             의 왼쪽의 표는 데이터의 의미를 파악하는 데 시간이 걸리는 반면 오른쪽의 그

                                             래프는 데이터 속성 간 상관관계를 한눈에 파악할 수 있다.



                                                                                 3그룹
                                   발    평균 매점    아침 식사   등교
                       이름    키                               식사량
                                  크기    방문 횟수    여부     순서                       2그룹
                        A    162.5  240   4.2     O      2     2                식사량(그룹)
                        В    181.8  280   4.6     X      5     3                  1그룹
                        C    154.2  230   3.3     O      7     1
                                                                                       1  2  3  4  5  6  7  8  9  10
                        D    168.0  265   2.8     X      6     2                                등교 순서
                                                                                             키와 발 크기 상관관계
                        Е    172.5  270   2.3     O      1     3
                                                                                  180
                        F    176.0  275   1.6     X      9     3                  170
                        G    159.9  235   4.0     O      3     1                  160
                                                                                키
                        H    174.0  275   5.1     X      8     3                  150
                                                                                  140
                        I    168.7  245   6.3     O      10    2
                                                                                  130
                        J    170.5  250   3.8     O      4     2
                                                                                     230  240  250  260  270  280
                                                                                                발 크기
                                      ▲ 표 형태의 데이터                                         ▲ 시각화된 데이터
                                                        그림Ⅲ-4 l 시각화를 통한 속성 관계 파악


                    126    Ⅲ 데이터와 기계학습
   123   124   125   126   127   128   129   130   131   132   133