Page 135 - 고등학교 인공지능 기초
P. 135
실습 하기 오렌지3
붓꽃에는 세 가지 품종이 있는데 눈으로 보아 구분하기는 쉽지
않다. 오렌지3에 등록된 ‘iris’(붓꽃 데이터)를 불러와 품종 구분과
관련되는 핵심 속성을 추출해 보자.
데이터 선택하기 - 붓꽃 데이터
① [Data] 섹션에서 [Datasets]을 클릭하고 [Iris]
붓꽃 데이터를 선택한다.
Datasets에 많은 데이터가 이미 등록되어 있다.
다양한 데이터를 선택해 그래프를 그려 볼 수
있다.
② [Data] 섹션에서 [Data Table]을 클릭하여 데
이터를 확인한다.
Iris 데이터에는 총 5개의 속성이 있고 첫 번째
속성인 iris가 예측하려는 레이블이다. 그리고
sepal_length(꽃받침 길이), sepal_width(꽃받침
너비), petal_length(꽃잎 길이), petal_width(꽃잎
너비) 속성이 있다.
③ [Visualize] 섹션의 [Distributions]을 클릭하
여 데이터의 분포를 확인한다.
속성별 분포를 보여주는 화면이다. iris 레이블은
setosa, versicolor, virginica, 총 3개이고 각각 50
개의 데이터가 있다. 왼쪽 Variables에서 다른 속
성을 클릭하여 속성별 분포도를 확인할 수 있다.
133
1. 데이터의 속성