Page 157 - 고등학교 인공지능 기초
P. 157
생각
확장하기 광학 문자 인식 기술
광학 문자 인식 기술(OCR: Optimal Character
Recognition)은 이미지 속에 있는 문자를 컴퓨터가
인식할 수 있는 디지털 문자로 변환하는 기술이다.
모바일과 개인용 컴퓨터의 처리 능력이 강화된 오
늘날에는 다양한 OCR 서비스를 일상적으로 접할
수 있게 되었다.
명함이나 서류 등 문서 이미지 속의 문자만 인식하던 과거와 달리 현재의 OCR은 사진이나 영상
속 문자까지 인식하는 기술로 발전했다.
OCR은 컴퓨터 비전 기술과 딥러닝 기반 알고리즘으로 인해 급격하게 발전하였는데 그 이유는
딥러닝 기반 알고리즘을 적용하면 사람이 문자를 등록하지 않아도 컴퓨터가 직접 대량의 데이터
학습을 통해 이미지에서 텍스트를 인식하는 규칙을 스스로 만들어내기 때문이다.
영상에서 문자 영역을 골라냈다면, 그 문자의 의
미를 파악하기 위해 먼저 텍스트 영역의 단어를 하
나의 문자로 각각 분리한다. 다음으로 글자를 인식
하기 위해 분류 모델을 통과하여 해당 문자가 무엇
인지 알아낸다. 분류 모델은 글자 인식에 필요한 특
징들을 파악하기 위해 사전에 대량의 데이터를 학습
하였으므로 새로운 글자를 분류할 수 있다.
마지막으로 출력된 텍스트의 내용을 확인하여 부
자연스러운 단어나 문자가 포함되면 고쳐서 정확도
를 높인다. 예를 들어, ‘홋길동’이라는 단어는 맥락상 이름임을 알 수 있고 ‘홋’이라는 성은 존재하
지 않으므로 ‘홍길동’이라고 수정한다.
실생활에서 사용되는 예로는 스마트 폰의 신용 카드 인식 서비스, 공항의 여권 자동 인식기, 시
각 장애인이 독서를 할 수 있도록 하는 프로그램, 과속 단속 카메라의 차량 번호 인식, 폰트 제작,
대량의 문서에서 정보 추출 등이 있다.
155
3. 분류 모델