OCR(Optical Character Recognition)이란?

광학문자인식은 무엇이고, 어떤 곳에 활용될까?

한국딥러닝 / 최예진

안녕하세요, 오늘도 여러분의 인공지능 이해도를 높여드릴 한국딥러닝입니다.

혹시 OCR이라는 기술을 들어보셨나요? 못 들어보셨다면, 아파트, 백화점 주차장에 들어가면 자동으로 차량번호가 인식되고, 스마트폰으로 신분증이나 신용카드를  카메라로 인식하면 카드번호가 저절로 입력되는 경험들은 다들 겪어보셨죠? 모두 OCR 기술을 활용한 문자 인식입니다.


< OCR>

OCR은 Optical Character Recognition, 즉 광학 문자 인식의 약칭입니다. 딥러닝 기술을 이용해 사람이 손으로 직접 쓴 필기 문자나 폰트 등의 인쇄, 웹용 글자 이미지를 스캔하여 텍스트로 변환하는 소프트웨어를 통틀어 이야기하죠. OCR은 관심이 있다면 한 번쯤 들어보셨을 ABBYY, 네이버 클라우드 플랫폼 등의 유명 OCR 프로그램 뿐만 아니라, 눈에 보이지 않는 수많은 분야에 쓰이고 있습니다. 



네이버 파파고 이미지 번역 엔진 [출처: 네이버]

일례로 네이버의 번역 프로그램 파파고에서는 글자가 써 있는 이미지 데이터를 글자로 변환하여 번역해 주는 이미지 번역을 서비스하고 있습니다.

파파고의 이미지 번역은 간판이나 전단지에 인쇄된 글자를 번역해야 할 때 유용한 기능으로 이미 많은 사용자를 보유하고 있어요.

뿐만 아닙니다! 각종 공공기관 및 은행 어플리케이션에서 본인확인 절차에 OCR을 활용하고 있기도 합니다. 

생소한 개념이라고 생각했지만, 생각보다 많은 곳에서 OCR 기술을 이용하고 있는 것 같죠?



< OCR>

OCR은 인공지능(AI)나 기계 시각(Machine Vision)의 연구분야로 시작되었습니다. 수동으로 텍스트를 입력할 필요 없이 컴퓨터가 읽을 수 있고, 컴퓨터로 편집할 수 있는 디지털 문서를 만드는 것은 모두가 필요로 했던 기능이었죠.

기존 폰트와 문서 이미지를 비교하여 이미지를 인식했던 초기 OCR 시스템은 특정한 서체를 읽기 위해 미리 해당 서체의 샘플을 읽는 트레이닝이 필요했습니다. 기술의 부재로 인해 이미지 속 문자만 인식했지요.

현재 OCR 기술은 그보다 훨씬 발전해서 딥러닝으로 문장의 앞뒤를 파악하여 단어를 추측하는 단계까지 발전했기 때문에 전처럼 별도의 트레이닝이 필요하지 않아 폰트의 제약이 훨씬 줄어들었고, 사진 뿐만 아니라 움직이는 영상 속 문자까지 인식할 수 있게 되었습니다.


< OCR>


1. 이미지 입력              :  스마트폰으로 촬영한 저화질 문서를 입력.

2. 문서 보정(전 처리) :  입력된 이미지를 프로세싱하여 자동으로 전처리.

3.문서 OCR                   :  전체 이미지에서 텍스트 영역을 골라내 문자들을 하나의 문자로 각각 인식 후, 딥러                                                 닝 시스템으로 의미를 파악.

4. 후 처리                       :  출력된 텍스트의 내용적인 부분을 따져서 부자연스러운 단어나 문자가 포함되면  이                                                를 수정하면서 정확도를 보다 향상.


< OCR>


앞에서 말씀드렸듯 OCR을 활용하고 있는 곳은 무궁무진합니다. 시각 장애가 있는 유저가 글자를 이해하는 데에 도움을 주기도 하고,  대량의 문서를 텍스트 파일로 바꿔야하거나 사람이 직접 글자를 읽어야만 했던 업무에 대체 투입되어 불필요한 인력 손실을 줄이고 있죠. 아래는 OCR이 사용되는 예시입니다. 

공항 셀프 체크인 키오스크  신분증 검사기  문서 관리

공항 셀프 체크인 키오스크를 보신 적이 있나요? 

이런 키오스크에서 여권을 인식할 때도 OCR 기술이 활용됩니다. 사람이 여권을 확인하는 것보다 빠르고 간편하게 체크인을 끝낼 수 있죠. 

각종 어플리케이션에 흔하게 쓰이는 신분증 검사기 또한 OCR을 사용하는 대표적인 경우입니다. 

복잡한 신분 인식 방법 대신 OCR 인식을 사용함으로써 훨씬 더 빠르게 신분증을 검사할 수 있습니다. 서류로 되어 있는 문서들에 OCR 기술을 활용하면 컴퓨터로 편집할 수 있는 디지털 파일로 변환되어 서류의 종류와 목적에 따라 효율적으로 관리할 수 있기도 합니다.

그 밖에도 명함관리, 시각장애인 음성지원, 차량번호 자동인식, 핀테크(신용카드 결제등록, 비대면 인증, 세금납부 등) 같은 곳에도 OCR이 활용되고 있습니다.


< 마치며... >


지금까지 OCR이 무엇인지, 어디에 활용하는 기술인지 알아보았는데요. 생소한 이름과 달리 생각보다 많은 곳에서 OCR 기술을 사용하고 있었습니다. 막연히 편리하다고 여겼던 인공지능 기술, 이름부터 활용법까지 알게 되면 더 알차게 이용할 수 있겠죠? 멀어 보였던 인공지능, 사실은 아주 가까운 곳에서 항상 우리를 도와주고 있었네요! 앞으로도 인공지능과 여러분의 거리가 더욱 좁아질 수 있도록 한국딥러닝이 도와드리겠습니다. 

감사합니다 :)




< OCR>


'잠시만요'는 한국딥러닝의 딥러닝 기술이 적용된 OCR방식을 활용합니다.

잠시만요 신분증 인식 프로세스 [제공: 한국딥러닝(주)]


미성년자, 알아서 차단하는 똑똑한 무인인식시스템

무인으로 확실하게! 1초만에 신분증 인식과 위변조 및 도용 판별까지 완벽하게 진행합니다. 


나이만 제한할 수 있냐고요? NO! 맞춤형 제한 조건

시간, 나이, 성별, 주소에 따라 출입 제한 조건을 간단하게 설정할 수 있습니다.


A/S는 신뢰의 상징! 잔고장 ZERO

기존 신분증 인식기의 잦은 고장을 탄탄한 기술력으로 해결! 믿고 사용하는 평생 A/S까지!


자리에 없어도, 실시간으로 매장 관리

24시간, 언제 어디서든 매장에 들어오는 출입자를 확인할 수 있습니다.


처음 보는 손님도, 나이 많은 점주님도

나이에 상관 없이 누구나 쉽게 이용할 수 있도록 전문 디자이너가 꼼꼼히 설계했습니다.

기업문화 엿볼 때, 더팀스

로그인

/