2012/11/08 10:40

[python] pytesser import 하기

1. 설치하기

http://code.google.com/p/pytesser/wiki/README 중 일부 내용이다.

Installation:

==============
PyTesser has no installation functionality in this release.  Extract pytesser.zip
into directory with other scripts.  Necessary files are listed in File Dependencies below.

설치가 필요가 없다. 압축만 풀면 된다고 한다.


다만 압축을 풀면 파일이 상당히 많다.

이 모듈을 사용하기 위해서는 실행 파일을 압축 해제 폴더에 넣어주던지, 경로를 조금 수정해서 작업을 해야한다.


아주 귀찮다.

그래서 import 시키기 편하게 만들어 볼까 한다.


2. import 하기

python 에서 import를 하면 몇 가지 경로를 찾는다.

그 중 한곳에 압축을 푼 폴더를 옮겨 준다. (ex:C:\Python27\Lib)

폴더 이름도 변경한다. (pytesser_v0.0.1 -> pytesser)


현재 작업 경로 : C:\Python27\Lib\pytesser


현 디렉터리 중 'pytesser.py' 파일을 복사한 후, 이름을 변경한다. (__init__.py)


3. __init__.py 파일 수정하기


현재 수정 파일 : C:\Python27\Lib\pytesser\__init__.py


12번째 라인 수정

수정 전)tesseract_exe_name = 'tesseract'

수정 후) tesseract_exe_name = 'C:\\Python27\\Lib\\pytesser\\tesseract'


4. 테스트

임의의 디렉터리에 test.py 파일을 생성한다. (동일 디렉터리에 'phototest.tif'를 복사해야 한다. )


# test.py

from pytesser import *
im = Image.open('phototest.tif')      // 경로 설정
text = image_to_string(im)
print text


========================= 결과 =========================

test dir>test.py
This is a lot of 12 point text to test the
ocr code and see if it works on all types
of file format.
The quick brown dog jumped over the
lazy fox. The quick brown dog jumped
over the lazy fox. The quick brown dog
jumped over the lazy fox. The quick
brown dog jumped over the lazy fox.


잘 되는구만..

저작자 표시
크리에이티브 커먼즈 라이선스
Creative Commons License
트랙백이 없고 댓글이 없습니다.


티스토리 툴바