Page 129 - 고등학교 인공지능 기초
P. 129

1. 식사량 분포도 분석
                           앞에서 제시한 반 친구 10명의 데이터를 그래프로 시각화하여 식사량 속성

                         과 상관관계가 있는 핵심 속성을 추출해 보자. 먼저 예측하려는 레이블인 식사
                         량이 어떻게 분포되어 있는지 확인한다.

                            2그룹(4명)              1그룹(2명)


                                   40%     20%              •1그룹 : 하루 식사 권장량보다 적게 먹는 그룹
                                                            •2그룹 : 하루 식사 권장량에 준하게 먹는 그룹
                                                            •3그룹 : 하루 식사 권장량보다 많이 먹는 그룹
                                        40%
                                                 3그룹(4명)
                                                             그림Ⅲ-5 l 식사량 그룹 분포


                           원그래프를 살펴보면 식사량은 2, 3그룹의 인원이 동일하고, 1그룹의 인원은                                 이름과 식사량 분석
                                                                                                   이름은 식사량에 영향을 끼치는
                         그보다 적다. 전반적으로 반 친구 10명의 식사량은 중간보다 많은 수준이라 할                               요인이 아니다. 따라서 이름과 식
                         수 있다.                                                                     사량은 그래프로 표현하는 과정을
                                                                                                   생략한다.
                           식사량과 다른 속성들을 각각 그래프로 그려보면 상관관계가 있는지 없는지
                         를 판단할 수 있다. 상관관계가 있다면 한 속성이 변화할 때 다른 속성도 증가
                         하거나 감소하는 경향성을 보인다.



                         2. 키와 발 크기에 따른 식사량 분석

                           아래 그림은 키, 발 크기에 따른 식사량 그룹 분포를 각각 그래프로 나타낸                                  상관관계
                                                                                                   상관관계란 두 속성 중 한쪽이 변
                         것이다.
                                                                                                   화하면 다른 한쪽도 따라서 변화
                                                                                                   하는 관계이다.
                           3그룹                                3그룹
                                                                                                    양의 상관관계  양의 상관관계는 한 속
                                                                                                          성이 변화하면 다른 속
                                                                                                          성도 같은 방향으로 변
                                                                                                          화하는 관계다.
                          식사량 그룹  2그룹                        식사량 그룹  2그룹                            음의 상관관계  음의 상관관계는 한 속
                                                                                                          성이 변화하면 다른 속
                                                                                                          성은 반대 방향으로 변
                                                                                                          화하는 관계다.
                                                                                                    상관관계 적음  한 속성의 변화에 따라
                           1그룹                                1그룹
                                                                                                          다른 속성이 변화하지
                                155  160  165  170  175  180      230  240   250  260  270  280           않는다면 상관관계가 적
                                           키(cm)                             발 크기(mm)
                                                                                                          다고 한다.
                                    ▲ 키에 따른 식사량 분포                    ▲ 발 크기에 따른 식사량 분포
                                                그림Ⅲ-6 l 키와 발 크기에 따른 식사량 그래프

                           키와 발 크기의 속성값이 클수록 식사량의 속성값도 커진다. 한 속성값이 변

                         화하면 다른 속성값도 일정한 방향으로 움직이므로, 키와 발 크기는 식사량과
                         양의 상관관계가 있음을 알 수 있다. 따라서 두 속성은 식사량을 예측하는 데
                         필요한 핵심 속성이다.


                                                                                                                   127
                                                                                                      1. 데이터의 속성
   124   125   126   127   128   129   130   131   132   133   134