[READIRIS PRO 14] 30가지이상의 언어를 인식하는 전문 OCR 프로그램 이미지의 문자를 타이핑할 필요없습니다.

4월 26, 2015

이미지의 문자를 타이핑하는 불편함을 싹 덜어주는 전문 OCR 프로그램 _ READIRIS PRO 14

스캐너를 사용한 것이 대학생 때였으니까 벌써 거의 20년 전 일입니다.
HP 의 스캐너를 구입했을 때 이상한 프로그램이 동봉되어 있더군요. 디스켓으로 양도 꽤 많이 말입니다.
그런데 그게 바로 아르미였던 것으로 기억합니다.

아르미는 스캔한 이미지(문서)에서 문자를 추출해서 수정 가능한 텍스트 상태로 만들어 주는 프로그램이었습니다.
그러나 막상 사용하면 영어와 한글만 될 뿐아니라 문자 인식에 어느정도 한계가 있어서
문자 오인식이 너무 많아서 테스트 몇번만 해보고 실제로 사용하지 않았습니다.
그러다 어느 정도 시간이 흘러 버전업된 아르미를 사용했을 때 인식율은 좋아졌지만, 그래도 좀 오류가 있더군요.
정말 몇년 만에 제가 본적 없는 OCR 프로그램을 접하게 되었네요
프로그램명은 READIRIS PRO 14로 IRIS 사의 제품입니다.

아참 OCR은 문서에서 텍스트를 추출하여 워드나 엑셀 파일로 텍스트를 변형해주는 프로그램들을 의미합니다.

패키지는 화이트에 스카이 블루 색상으로 깔끔해 보이네요
여러가지 문서 및 클라우드 기능을 포함하고 있음을 패키지에서 보여주고 있습니다.
종이 박스를 열면 안쪽에 또다른 패키지가 있습니다.
CD 및 설명서등을 포장한 DVD케이스와 같은 패키지입니다.
바깥 종이 박스는 보호형 패키지라고 생각하면 될 듯하네요.

패키지를 열어보면 여러가지 팜플렛및 설명서 그리고 CD가 포함되어 있습니다.
그리고 패키지 안쪽에 인증번호가 포함되어 있습니다.
스티커로 붙어 있으며 사진상으로는 안 보이도록 하였습니다.

설치를 시작하면 언어를 선택하고 라이센스에 동의한 후 이름과 조직을 입력합니다.
여기까지는 특별한 부분이 없겠죠? 전 전체설치로 설치하였지만
만약 사용자 정의 설치를 한다면?? 여러가지 언어를 선택할 수 있습니다.
중간에 사용자 정의 설치시 나오는 언어의 예를 볼 수 있습니다.
전체설치 선택후 [다음]을 선택하고 다음화면에서 [설치]를 선택하고 일정시간 이후 완료됩니다.

프로그램을 시작 버튼을 선택한후 Readiris Pro 14를 선택하면 실행이 되는데
초기 실행시 인증번호 즉 활성화 코드를 입력할 것인지 물어봅니다.
만약, 10일동안 체험판으로 사용하려면 [Activate later]을 선택하며, 정품이라면 활성화코드 입력을 위해서 [확인]을 선택합니다.
그리고 활성화번호가 있는 경우 활성화 코드가 꽤 길며 사용해 보고 괜찮다면 직접 온라인 상에서 구매할 수 있습니다.
활성화 코드를 입력하고 일정시간이 지나면 활성화되었다는 메시지가 나오면 정품 사용자가 됩니다.
전 물론 정품 인증자입니다.

프로그램이 실행되면 다음과 같은 인터페이스로
좌측편에는 스캔한 이미지 중앙에는 스캔한 이미지의 텍스트 추출부분이 표시됩니다.
상단에는 다양한 기능을 선택할 수 있는데 탭형태로 되어 있으며,
사용하기 쉽도록 1,2 숫자를 붙여서 사용자 편의성을 높혔습니다.
그리고 중앙에는 한번에 실행할 수 있는 퀵런처가 있습니다.

사용하기 전에는 우선 스캐너를 등록해야합니다.
상단 메뉴중 스캔 하단부분을 클릭하고 [설정]을 선택합니다.
스캐너 창이 나타나면 유형의 [스캐너 모델]을 선택하는데 제가 사용하는 엡손 L210 모델의 경우 복합기라 그런지
아니면 해외에 없는 것인지 리스트에 없습니다. 그럴 경우 설명서에는 를 선택하라고 되어 있습니다.
스캐너 모델을 선택하면 몇가지 설정할 수 있는 옵션들이 나타나며,
OCR 사용시 300dpi이상의 해상도를 사용하는 것이 좋다고 합니다.
스캐너 설정까지 완료되었다면? 이제 언어를 선택할 것입니다. 언어탭의 메인항목에서 선택할 수 있습니다.
보조 언어의 경우 PRO버전이 아닌 더 상위버전에서 지원하는 것 같습니다.

획득 탭의 스캔을 누르면 스캐너에 있는 문서를 스캔하게 됩니다.
그런데 지금 현재 문서는 거꾸로 스캔이 되어 있습니다.
구성탭에서 회전을 누르는 것으로 문서가 회전되지 않기 때문에 페이지 메뉴에서 그림과 같이 회전 메뉴를 활용해야합니다.
문서가 뒤집혀 있거나 방향이 잘 못 되어 있다면? 문자인식에 오류가 발생하므로 방향을 꼭 수정해야합니다.

그리고 출력탭에서 출력될 문서 형식을 설정해야합니다.
여러가지 문서를 지원하지만 아래아한글의 경우 한국에서만 사용되므로 지원양식에 없다는 점 참고하여야합니다.
아무튼 엑셀이나 워드, 텍스트 문서 등 여러가지 문서 타입을 지원하는데 문서 부분을 선택하면
출력 창이 열리면서 문서 형식을 선택할 수 있습니다.
출력될 문서까지 설정이 완료되었다면?
출력탭의 종이비행기 아이콘이 있는 [보내기]를 선택합니다.
선택된 문서 형식으로 파일명을 저장하고 위치를 설정할 수 있습니다.

이 프로그램에서 조금 독특한 부분은 바로 클라우드 지원 서비스입니다.
Evernote, Dropbox, Google Drive, Box, SkyDrive를 지원하는데요 그중 Google Drive를 테스트 해보았습니다.
일단 클라우드 설정 메뉴로 가서 해당 클라우드에 대한 설정을 합니다.
구글 클라우드 설정은 머 간단하여 사용자 이름과 패스워드를 넣으면 됩니다.
경로가 필요하다면 추가로 설정할 수도 있습니다.
홈 메뉴로 가서 출력탭을 선택하고 구름 모양의 아이콘에서 설정한 클라우드인 Google Drive를 선택하고 [보내기]를 선택합니다.
찾아보기 창이 뜨면서 저장할 위치를 확인하고 [확인]을 누르면 저장하기 전에 파일이름을 설정하게 되면
저장이 되게 됩니다. 실제 구글 드라이브에 저장된 모습입니다.
구글 드라이브를 전 PC에도 설치하였기 때문에 자동으로 PC와도 동기화됩니다.

자 그럼 문자를 얼마나 잘 인식하는지 알아야겠죠?
스캔한 이미지를 해상도 150dpi로 일단 낮춘 이미지로 원래 크기의 절반입니다.
문자 인식율은 오타 없이 영문을 깔끔하게 인식이 됩니다.
다음은 한국어랑 일본어를 살펴보도록 할까요?

한국어의 경우 입니다. 출력된 문서를 다시 스캔한 것으로 300dpi문서를 100dpi로 조정하여 이미지로 올렸습니다.
한글인식은 거의 오타가 없는데 한글과 섞인 영문에서 영문O나 숫자0을 오인식한 부분이 있습니다.
체크표시는 문자가 아니라 오류로 인식된 부분은 충분히 이해할 수 있는 부분인데,
약간의 혼용된 영문에서 오인식이 있긴 하지만 이정도면 한글 한번 인식하고 영문 추가로 인식하여 합쳐서 사용할 수는 있겠지만
그래도 조금 아쉬운 부분은 있습니다. 다른 문자들은 이상 없이 정확하게 인식이 되었습니다.
아무튼 영문 O와 숫자 0이 일부에서 오류있는 부분은 앞으로 혹시라도 패치등을 통해서 개선되었으면 좋겠네요.

이제 영문과 혼용된 일본어 입니다. 사진들은 모두 모자이크 하였으며 역시 300dpi를 100dpi로 조정한 이미지입니다.
OCR작동시에는 300dpi문서 이상을 사용해야하므로 참고하시고요.
영문과 혼용된 일본어 및 한자는 거의 오류없이 인식이 되었습니다.
한글보다는 인식율이 더 높은데 약간은 오류가 있긴 하지만 문서내에 2-3곳 정도라 큰 문제될 정도는 아니라 생각됩니다.

전체적으로 우수한 인식율을 가지고 있고 다양한 언어를 사용할 수 있다는 장점이 있는 OCR 프로그램,
사실 OCR 프로그램 활용도가 높지는 않겠지만 필요하신 분들이라면? 정말 추천할 만한 프로그램이라 생각됩니다.
문제는 가격이겠죠? 실제 구매 가격은 대략 17만원정도 하는 듯합니다.
가격이 비싸고 싸고 이 부분에 대해서는 따로 언급하지 않겠습니다. 구매자가 판단할 부분이니까요.

이 블로그 검색

Steve in Design

[READIRIS PRO 14] 30가지이상의 언어를 인식하는 전문 OCR 프로그램 이미지의 문자를 타이핑할 필요없습니다.

댓글

댓글 쓰기

이 블로그의 인기 게시물

사가공항 근처에서 즐기는 놀이터 히가타요카 공원 干潟よか公園 아이가 있다면 꼭 들려야할 명소 Higatayoka_Park

북해도 북해도 렌터카 여행 토요타 스페이드 넓고 효율적인 차량 TOYOTA SPADE

주파수 광대역 RF 방식 초소형 하이패스 GPASS AP500 클린패키지 출장 장착으로 편하게