Page 135 - 고등학교 인공지능 기초
P. 135

실습 하기          오렌지3



                              붓꽃에는 세 가지 품종이 있는데 눈으로 보아 구분하기는 쉽지
                              않다. 오렌지3에 등록된 ‘iris’(붓꽃 데이터)를 불러와 품종 구분과
                              관련되는 핵심 속성을 추출해 보자.



                               데이터 선택하기 - 붓꽃 데이터
                              ①  [Data] 섹션에서 [Datasets]을 클릭하고 [Iris]
                                붓꽃 데이터를 선택한다.
                                   Datasets에 많은 데이터가 이미 등록되어 있다.
                                 다양한 데이터를 선택해 그래프를 그려 볼 수
                                 있다.








                              ②  [Data] 섹션에서 [Data Table]을 클릭하여 데
                                이터를 확인한다.
                                    Iris 데이터에는 총 5개의 속성이 있고 첫 번째
                                 속성인 iris가 예측하려는 레이블이다. 그리고
                                 sepal_length(꽃받침 길이), sepal_width(꽃받침
                                 너비), petal_length(꽃잎 길이), petal_width(꽃잎
                                 너비) 속성이 있다.







                              ③  [Visualize] 섹션의 [Distributions]을 클릭하
                                여 데이터의 분포를 확인한다.
                                   속성별 분포를 보여주는 화면이다. iris 레이블은
                                 setosa, versicolor, virginica, 총 3개이고 각각 50
                                 개의 데이터가 있다. 왼쪽 Variables에서 다른 속
                                 성을 클릭하여 속성별 분포도를 확인할 수 있다.
















                                                                                                                   133
                                                                                                      1. 데이터의 속성
   130   131   132   133   134   135   136   137   138   139   140