Page 137 - 고등학교 인공지능 기초
P. 137

실습 하기     오렌지3



                               핵심 속성 추출
                              데이터 시각화 결과 꽃받침의 길이와 너비로 품종을 구분하는 그래프보다 꽃잎의 길이와 너비로 품종을 구분하는 그래
                              프가 붓꽃의 품종을 잘 구분한 것을 확인했다. 따라서 꽃잎의 길이와 너비를 핵심 속성으로 선택한다.


                              ①  꽃잎 길이와 꽃잎 너비 속성만 핵심 속성
                                으로 선택하기 위해 [Data] 섹션의 [Select
                                Columns]에서 Features의     버튼으로
                                핵심 속성이 아닌 속성을 제거한다.

                                    [Select Columns]는 핵심 속성을 선택하는 기능
                                 이다. Available variables는 선택되지 않은 속
                                 성이고, Features는 선택된 속성이다. Target
                                 Variable는 분류하려는 레이블이다. 별다른 조작
                                 을 하지 않으면 모든 속성을 선택하므로 Feature
                                 에 모든 속성이 들어가 있다.




                              ②  최종적으로 핵심 속성만 잘 선택되었는지 확
                                인하기 위해 [Data] 섹션의 [Data Table]을
                                [Select Columns]에 연결해 선택된 속성을
                                확인한다.























                                                                                                             3줄 요약

                             1.   데이터는 여러 속성으로 구성되어 있다.
                             2.  레이블과 관련 있는 속성을 핵심 속성이라고 한다.
                             3.  핵심 속성은 데이터를 시각화하여 여러 속성 간의 관계를 파악함으로써 추출할 수 있다.





                                                                                                                   135
                                                                                                      1. 데이터의 속성
   132   133   134   135   136   137   138   139   140   141   142