Page 157 - 고등학교 인공지능 기초
P. 157

생각
                              확장하기         광학 문자 인식 기술




                              광학 문자 인식 기술(OCR: Optimal Character
                            Recognition)은 이미지 속에 있는 문자를 컴퓨터가

                            인식할 수 있는 디지털 문자로 변환하는 기술이다.
                            모바일과 개인용 컴퓨터의 처리 능력이 강화된 오
                            늘날에는 다양한 OCR 서비스를 일상적으로 접할

                            수 있게 되었다.


                              명함이나 서류 등 문서 이미지 속의 문자만 인식하던 과거와 달리 현재의 OCR은 사진이나 영상

                            속 문자까지 인식하는 기술로 발전했다.



                              OCR은 컴퓨터 비전 기술과 딥러닝 기반 알고리즘으로 인해 급격하게 발전하였는데 그 이유는
                            딥러닝 기반 알고리즘을 적용하면 사람이 문자를 등록하지 않아도 컴퓨터가 직접 대량의 데이터
                            학습을 통해 이미지에서 텍스트를 인식하는 규칙을 스스로 만들어내기 때문이다.



                              영상에서 문자 영역을 골라냈다면, 그 문자의 의

                            미를 파악하기 위해 먼저 텍스트 영역의 단어를 하
                            나의 문자로 각각 분리한다. 다음으로 글자를 인식
                            하기 위해 분류 모델을 통과하여 해당 문자가 무엇

                            인지 알아낸다. 분류 모델은 글자 인식에 필요한 특
                            징들을 파악하기 위해 사전에 대량의 데이터를 학습
                            하였으므로 새로운 글자를 분류할 수 있다.



                              마지막으로 출력된 텍스트의 내용을 확인하여 부
                            자연스러운 단어나 문자가 포함되면 고쳐서 정확도

                            를 높인다. 예를 들어, ‘홋길동’이라는 단어는 맥락상 이름임을 알 수 있고 ‘홋’이라는 성은 존재하
                            지 않으므로 ‘홍길동’이라고 수정한다.

                              실생활에서 사용되는 예로는 스마트 폰의 신용 카드 인식 서비스, 공항의 여권 자동 인식기, 시
                            각 장애인이 독서를 할 수 있도록 하는 프로그램, 과속 단속 카메라의 차량 번호 인식, 폰트 제작,
                            대량의 문서에서 정보 추출 등이 있다.






                                                                                                                   155
                                                                                                        3. 분류 모델
   152   153   154   155   156   157   158   159   160   161   162