Skip to content

Tesseract-OCR을 이용한 문자추출 (windows기반)

Notifications You must be signed in to change notification settings

sonwonrak92/ocr_test

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

#####Windows기반

Optical Character Reader

Tesseract-OCR을 이용한 문자추출

문자인식을 대표하는 오픈소스 중 하나이며, 엔진이다.

공식깃헙주소 : https://github.com/tesseract-ocr/tesseract

tesseract설치

설치주소 : https://github.com/tesseract-ocr/tesseract/wiki

추가 언어 업데이트 : https://github.com/tesseract-ocr/tessdata_best

  • 설치는 각자의 환경에 맞는 것으로 선택해서 설치

  • tesseract설치와 동시에 언어데이터도 함께 설치하기를 원하면 설치 진행 중 Additional language data부분의 체크박스를 클릭


cmd에서 라이브러리 설치과정

pillow

파이썬 이미지 처리 라이브러리

// 이미지합성, 이미지포맷 변환, 회전하기 등

  • 아래의 명령어를 입력하여 pillow라이브러리 설치

    pip install pillow

pytesseract

Tesseract-OCR의 기능을 파이썬에서 호출할 수 있게 해주는 라이브러리

  • 아래의 명령어를 입력하여 pytesseract라이브러리 설치

    pip install pytesseract


openCV을 이용한 image processing

opencv 설치

pip install opencv-python

About

Tesseract-OCR을 이용한 문자추출 (windows기반)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages