Page 234 - 고등학교 인공지능 기초
P. 234

정답 및 해설



                        10 l                                            03 l 두 번째 그래프를 보면 가격이 낮을수록 예약 건수도 낮은 경향
                                                                        을 보인다. 위도와 그래프는 산발적인 점 그래프로 나타나므로 특별
                                                                        한 관련성이 없다. 숙박 유형은 집 전체, 개인실, 다인실 순서로 많다.

                                                                        04 l 정형 데이터와 비정형 데이터 모두 인공지능 학습에 활용된다.
                                                                        정형 데이터는 미리 정해진 형태로 구조화되어 나타난 데이터이므로
                                                                        비상 연락망은 정형 데이터다. 비정형 데이터는 정해진 형태로 구조화
                                                                        되지 않은 데이터로 텍스트, 이미지, 음성, 영상 등이 해당된다. 딥러닝
                                                                        등정 전의 전통적인 기계 학습에서는 정형 데이터를 주로 활용했다.


                                                                        05 l •문제정의 : 주어진 상황을 정확하게 파악하고 분석하여 분류
                                                                        모델로 무엇을 할 것인지 구체적으로 생각해 보는 과정이다.
                                                                        • 데이터 시각화 : 확보한 데이터의 속성들의 상관관계를 쉽게 파악
                                                                         하기 위해 시각적으로 표현해 보는 과정이다.
                                                                        • 분류 모델 학습 : 분류 알고리즘과 추출된 핵심 속성을 이용하여 분
                                                                         류 모델 학습을 진행하는 과정이다.
                                                                        • 모델 성능 평가 : 새로운 데이터에 대해 얼마나 정확하게 결과를 출
                        11 l ① 모델1 : 98%, 모델2: 5%                        력하는지 알기 위해 정확도를 구하는 과정이다.
                        ② 모델2는 다른 데이터에 비해 우는 표정 데이터의 개수가 충분하지
                        않아 우는 표정에 대한 학습이 잘 이루어지지 못했기 때문이다.              06 l 보통 전체 데이터에서 80%는 훈련 데이터로 사용하고 20%는
                                                                        테스트 데이터로 사용한다. 훈련 데이터는 분류 모델이 올바르게 학
                                                                        습할 수 있게 하는 역할을 한다. 테스트 데이터는 기계 학습 모델이
                                                                        얼마나 정확하게 학습하였는지 판단하기 위해 사용하는 데이터이다.
                            Ⅲ    인공지능의 원리와 활용
                                                                        좋은 훈련 데이터는 속성값이 편중되어 있지 않아야 한다.
                          01 ④    02 ④    03 ①    04 ③     05 ③
                                                                        07 l k-최근접 이웃 알고리즘은 미리 정한 개수만큼의 이웃이 얼마
                          06 ②    07 ⑤    08 ①    09 ④
                                                                        나 가까이 있는지 조사하여 다수결로 분류한다. 3, 5, 7로 정했을 경우
                          10 해설 참조
                                                                        각각의 원 안에 있는 가장 많은 종류의 모양으로 결정된다.
                          11 해설 참조
                          12 해설 참조
                                                                        08 l 정확도는 테스트 데이터를 얼마나 정확하게 분류했는지를 나타
                                                                        내는 지표이다. 전체 테스트 데이터의 샘플 중에서 정답인 결과의 비
                        01  l  핵심 속성은 레이블 속성을 예측하는 데 필요한 속성이므로,         율이다. 종류와 분류모델결과를 비교하면 7/10*100으로 70%의 정확
                        레이블인 예약 건수와 관련 없는 속성은 핵심 속성이라 할 수 없다.           도인 것을 알 수 있다.
                        데이터는 표 형태의 정형 데이터다. 예측하고자 하는 속성을 레이블
                        이라고 하므로 예약 건수가 레이블이다. 인공지능 학습 전 누락되거            09 l 화면에서 핵심속성을 고르고 이웃의 개수를 설정하는 것은 분
                        나 잘못된 데이터를 수정하는 과정이 필요한데 이를 데이터 전처리             류 모델 학습 단계에서 결정한다.
                        라 한다.
                                                                        10 l 예시 답안
                        02 l 위 데이터에 등장하는 속성은 호스트 이름, 숙박 유형, 위도, 경       잘못된 데이터로 인공지능을 학습시키면, 학습 시간도 오래 걸리고
                        도, 가격, 예약 건수이다. 개인실은 숙박 유형 속성의 값 중 하나이다.        결과물 성능도 떨어지기 때문이다. 따라서 양질의 데이터를 선별하고,
                                                                        결측값 및 이상값을 보완하는 과정 즉, 데이터 전처리가 필요하다.






                    232    정답 및 해설
   229   230   231   232   233   234   235   236   237   238   239