Page 130 - 고등학교 인공지능 기초
P. 130
3. 평균 매점 방문 횟수, 등교 순서에 따른 식사량 분석
[그림Ⅲ-7]은 평균 매점 방문 횟수, 등교 순서에 따른 식사량 그룹 분포를 그
래프로 나타낸 것이다.
순서형 속성 3그룹 3그룹
관찰 대상에 정도의 변화가 있는
속성이나 대상의 순서를 나타낸
속성을 순서형 속성이라 한다. 식 식사량 그룹 2그룹 식사량 그룹 2그룹
사량 속성은 정도의 변화가 있으
므로 순서형 속성이고, 등교 순서
속성 역시 대상의 순서를 의미하
므로 순서형 속성이다. 1그룹 1그룹
2 3 4 5 6 2 4 6 8 10
평균 매점 방문 횟수(일주일) 등교 순서
▲ 평균 매점 방문 횟수에 따른 식사량 분포 ▲ 등교 순서에 따른 식사량 분포
그림Ⅲ-7 l 평균 매점 방문 횟수와 등교 순서에 따른 그래프
평균 매점 방문 횟수와 등교 순서의 속성값이 증가할 때 식사량의 속성값이
증가하거나 감소하는 등의 일정한 경향이 보이지 않으므로 상관관계가 적다. 따
라서 두 속성은 식사량을 예측하는 데 필요한 핵심 속성이 아니다.
4. 아침 식사 유무에 따른 식사량 분석
범주형 속성 아침 식사 유무에 따른 식사량 분포를 원그래프로 표현하면 [그림Ⅲ-8]과
범주를 나타내는 데이터를 범주형
같다.
속성이라 한다. 아침 식사 유무는
O, X만으로 구성되어 있는 범주형
속성이다. 2그룹(1명) 1그룹(2명)
25% 33.3%
0% 1그룹(0명)
75% 50% 16.7%
2그룹(3명)
3그룹(1명)
3그룹(3명)
▲ 아침 식사를 하지 않는 학생의 식사량 분포 ▲ 아침 식사를 하는 학생의 식사량 분포
그림Ⅲ-8 l 아침 식사 유무에 따른 식사량 그래프
아침 식사를 하는 학생들의 식사량은 대부분 1그룹 또는 2그룹이고 아침 식
사를 하지 않는 학생들은 모두 식사량이 2그룹 또는 3그룹이다. 즉 아침 식사
를 하지 않을수록 식사량이 많다고 판단할 수 있다. 따라서 아침 식사 여부는
식사량 예측에 필요한 핵심 속성이다.
128 Ⅲ 데이터와 기계학습