PYTHON 프로그래밍

본문 바로가기
사이트 내 전체검색


PYTHON 프로그래밍
PYTHON 프로그래밍

1. Python에서 tesseract를 이용하기

페이지 정보

작성자 관리자 댓글 0건 조회 2,855회 작성일 21-01-07 14:27

본문

1. Python에서 tesseract를 이용하기

Python에서 tesseract를 이용하기 위해 관련 모듈인 Python-tesseract를 설치해줘야 한다.


GitHub - madmaze/pytesseract: A Python wrapper for Google Tesseract 


Python-tesseract는 Google의 Tesseract-OCR Engine에 대한 wrapper다.


pip를 이용한 설치:


pip install pytesseract


python에서 tesseract를 사용하는 방법은 아주 간단하다. pip를 통해 설치한 pytesseract를 import하고, 앞서 설치한 tesseract 경로만 명시적으로 등록해주기만 하면 된다.


이미지로부터 텍스트를 추출하는 함수는 pytesseract.image_to_string() 이다.


파일명 : test.py


import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'


print(pytesseract.image_to_string('./img_08.png'))



1.JPG



옵션을 주고 싶을 경우에는 아래와 같이 파라미터를 전달하여 함수를 호출 하면 된다.


pytesseract.image_to_string('img.png', lang='eng', config='--psm 1 -c preserve_interword_spaces=1')



OCR 정확도 개선

Tesseract는 배경으로부터 전경 텍스트가 깨끗히 세분화가있을 때 가장 효과적인 결과를 얻을 수 있다. 
따라서, 보다 높은 텍스트 인식률을 달성하기 위해서는 OCR 수행에 앞서 반드시 원본이미지에 대한 전처리 과정이 포함되어야 한다.

다음은 OpenCV를 이용하여 Tesseract OCR 인식률을 높이기 위한 전처리 방법들 중 일부를 소개한다.


2.JPG


그레이 스케일로 변환하기


import cv2


image = cv2.imread('2.JPG')

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

cv2.imshow("원본", image)

cv2.imshow("Gray", gray)

배경에서 전경 텍스트를 분할하기 위해 임계값을 사용한다. 

이러한 임계값 사용은 회색 배경 위에 겹쳐진 검은색 텍스트를 읽는 데 유용하다.


gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

cv2.imshow("Gray2", gray)


임계값 사용 대신, 블러(Blur) 처리를 적용될 수있다. 

medianBlur를 적용하면 이미지의 노이즈를 줄일 수 있다.


gray = cv2.medianBlur(gray, 5)

cv2.imshow("medianBlur", gray)


cv2.waitKey(0)

cv2.destroyAllWindows()


3.JPG


4.JPG


References

댓글목록

등록된 댓글이 없습니다.


개인정보취급방침 서비스이용약관 모바일 버전으로 보기 상단으로

TEL. 063-469-4551 FAX. 063-469-4560 전북 군산시 대학로 558
군산대학교 컴퓨터정보공학과

Copyright © www.leelab.co.kr. All rights reserved.