Page 145 - 고등학교 인공지능 기초
P. 145

2     데이터 유형과 기계학습



                           기계학습은 딥러닝 전과 후로 나눌 수 있다. 딥러닝 등장 이전의 전통적인 기

                         계학습에서는 통계적 기법을 주로 사용했고, 딥러닝 등장 이후에는 인공 신경
                         망을 활용한다.
                           전통적인 기계학습에서는 주로 정형 데이터를 다뤘는데, 그 이유는 비정형

                         데이터에서는 성능이 만족스러운 수준에 이르지 못했기 때문이다. 그러나 딥러
                         닝 기법이 적용되면서 정형 데이터뿐 아니라 비정형 데이터에서도 성능이 크

                         게 향상되었다.
                           딥러닝이 등장하기 전 전통적인 기계학습에서는 비정형 데이터를 정형 데이
                         터로 변환하는 과정을 거쳤다. 사람 얼굴을 인식하고 구분하는 인공지능을 만

                         드는 상황을 예로 들어 보자. 비정형 데이터인 얼굴 이미지를 정형화하려면 얼
                         굴을 구분할 수 있는 속성을 추출하고, 속성값을 표 형태로 정리해야 한다.


                           정형 데이터를 활용한 이미지 인식

                                                          눈의   눈의   코
                                               사람  눈썹 각도                입술 두께
                                                         가로 비율 세로 비율  길이
                                               김**   5    8    2    5.5  1.4
                                               최**   10   6    4    4.2  1.8
                                               박**   2    7    3    6.5  1.5
                                                …    …    …    …    …    …




                           반면 딥러닝은 정형 데이터뿐만 아니라 비정형 데이터의 학습 정확도도 높다.
                         따라서 이미지를 정형 데이터로 변환하는 과정 없이, 그대로 학습 데이터로 사
                         용할 수 있다. 전통적인 기계학습과 달리 딥러닝의 비정형 데이터 학습 성능이

                         급격히 향상된 이유는 인공 신경망을 사용하기 때문이다. 인공 신경망은 여러                                  인공 신경망을 거치면서 비정형 데
                         은닉층을 거치면서 이미지의 두드러진 특징을 포착할 수 있다.                                       이터가 학습되는 과정

                                                                                                    입력
                           비정형 데이터를 활용한 이미지 인식

                                                                                                  입력층


                                                                                                  은닉층


                                                                                                  출력층

                                                                                       그림Ⅲ-14
                                                                                                    출력
                                                                                    얼굴의 특징 부분을
                                                                                    포착하는 딥러닝


                                                                                                                   143
                                                                                              2. 정형 데이터와 비정형 데이터
   140   141   142   143   144   145   146   147   148   149   150