Page 145 - 고등학교 인공지능 기초
P. 145
2 데이터 유형과 기계학습
기계학습은 딥러닝 전과 후로 나눌 수 있다. 딥러닝 등장 이전의 전통적인 기
계학습에서는 통계적 기법을 주로 사용했고, 딥러닝 등장 이후에는 인공 신경
망을 활용한다.
전통적인 기계학습에서는 주로 정형 데이터를 다뤘는데, 그 이유는 비정형
데이터에서는 성능이 만족스러운 수준에 이르지 못했기 때문이다. 그러나 딥러
닝 기법이 적용되면서 정형 데이터뿐 아니라 비정형 데이터에서도 성능이 크
게 향상되었다.
딥러닝이 등장하기 전 전통적인 기계학습에서는 비정형 데이터를 정형 데이
터로 변환하는 과정을 거쳤다. 사람 얼굴을 인식하고 구분하는 인공지능을 만
드는 상황을 예로 들어 보자. 비정형 데이터인 얼굴 이미지를 정형화하려면 얼
굴을 구분할 수 있는 속성을 추출하고, 속성값을 표 형태로 정리해야 한다.
정형 데이터를 활용한 이미지 인식
눈의 눈의 코
사람 눈썹 각도 입술 두께
가로 비율 세로 비율 길이
김** 5 8 2 5.5 1.4
최** 10 6 4 4.2 1.8
박** 2 7 3 6.5 1.5
… … … … … …
반면 딥러닝은 정형 데이터뿐만 아니라 비정형 데이터의 학습 정확도도 높다.
따라서 이미지를 정형 데이터로 변환하는 과정 없이, 그대로 학습 데이터로 사
용할 수 있다. 전통적인 기계학습과 달리 딥러닝의 비정형 데이터 학습 성능이
급격히 향상된 이유는 인공 신경망을 사용하기 때문이다. 인공 신경망은 여러 인공 신경망을 거치면서 비정형 데
은닉층을 거치면서 이미지의 두드러진 특징을 포착할 수 있다. 이터가 학습되는 과정
입력
비정형 데이터를 활용한 이미지 인식
입력층
은닉층
출력층
그림Ⅲ-14
출력
얼굴의 특징 부분을
포착하는 딥러닝
143
2. 정형 데이터와 비정형 데이터