Page 136 - 고등학교 인공지능 기초
P. 136

 데이터 시각화
                        붓꽃 데이터에는 꽃받침 길이, 꽃받침 너비, 꽃잎 길이, 꽃잎 너비, 품종, 총 다섯 개의 속성이 있다. 이 중 우리가 분류하
                        고 싶은 것은 붓꽃의 품종이다. 여러 속성을 선택하여 붓꽃의 품종을 구분하는 그래프를 그려 보자.


                        ①  [Visualize] 섹션에서 [Scatter Plot]을 선택해
                          꽃받침의 길이와 너비로 품종을 구분하는 그
                          래프를 그린다.

                              Axis x(x축)는 [sepal_length(꽃받침 길이)], Axis
                            y(y축)는 [sepal_width(꽃받침 너비)], color는
                            [iris(품종)]를 선택한다. 하단 opacity는 불투명도
                            를 의미한다. opacity를 오른쪽으로 드래그하면
                            색상이 선명한 그래프가 그려진다.








                        ②  꽃잎의 길이와 너비로 품종을 구분하는 그래
                          프를 그린다.
                             Axis x(x축)는 [petal_length(꽃잎 길이)], Axis
                            y(y축)는 [petal_width(꽃잎 너비)], color는
                            [iris(품종)]를 선택한다.













                             꽃받침 길이-꽃받침 너비로 품종을 구분하는 그래프보다 꽃잎 길이-꽃잎 너비로 품종을 구분하는 그래프가 붓꽃의 품종을 잘 구분
                            한다. 따라서 핵심 속성을 꽃잎 길이와 꽃잎 너비로 결정할 수 있다.


















                    134    Ⅲ 데이터와 기계학습
   131   132   133   134   135   136   137   138   139   140   141