tesseract ocr 다운로드

사용 되지 않는 차원에 대 한 교육 데이터 버전 = < 3.02는 다른 위치에 상주 합니다. 이전 버전 3.02에 대 한 설치 관리자는 다운로드 페이지에서 Windows 용으로 사용할 수 있습니다. 여기에는 영어 교육 데이터가 포함 됩니다. 다른 언어를 사용 하려는 경우 적절 한 교육 데이터를 다운로드 하 고 7-zip을 사용 하 여 압축을 풀고 .tortedata 파일을 디렉토리에 복사 합니다 (아마 C:filestessdatact-ryudir). Tesseract 또한 아파치 라이센스 2.0의 조건에 따라 자신의 프로젝트에서 사용할 수 있습니다. 그것은 완전 한 기능을 갖춘 API를가지고 있으며, 안 드 로이드와 아이폰을 포함 한 다양 한 대상에 대해 컴파일 할 수 있습니다. 이 작업을 수행한 샘플은 3rdParty 페이지를 참조 하십시오. 그러나 아직 거의 3rdParty 차원 OCR 프로젝트 Mac 용으로 개발 되 고 있습니다 (만 하나의 Tesseract 맥 Os), 거기에 몇 가지 온라인 OCR 서비스를 사용할 수 있는 Mac에서 사용 하는 그들의 OCR 엔진으로. 즉시 Tesseract-OCR 시스템에 설치 되어, 당신은 커맨드 라인을 통해 배포 하 고 즉시 사용을 시작할 수 있을 것입니다.

대상 파일에서 작업할 때 적용할 몇 가지 매개 변수만 있고 충분히 설명 되어 있습니다. Tesseract는 또한 각 단어의 좌표로 특별 한 HTML 파일을 생성 하는 hOCR 모드를 포함 한다. Hocr2PDF와 같은 도구를 사용 하 여 검색 가능한 pdf를 만드는 데 사용할 수 있습니다. 그것을 사용 하 여, 다음과 같이 ` hocr ` 구성 옵션을 사용 하 여: Tesseract 3.05 및 Tesseract 4에 대 한 Windows 용 설치 프로그램은 UB만 하 임에서 Tesseract에서 사용할 수 있습니다. 여기에는 교육 도구가 포함 됩니다. 32 비트 및 64 비트 설치 프로그램을 모두 사용할 수 있습니다. Tesseract에는 기본 제공 GUI가 없지만 3rdParty 페이지에서 여러 가지를 사용할 수 있습니다. Tesseract의 주요 강력한 포인트 중 하나-OCR은 인식 하 고 다양 한 그래픽 이미지 파일 형식을 처리 하는 기능입니다. 이 유틸리티에 대 한 또 다른 좋은 점은 모든 사용자의 요구를 충족 시켜야 하는 처리 속도입니다. 에 액세스 하려면-OCR 이진 파일은 경로 변수에 위치 하 고 있는 디렉토리를 추가 할 수 있습니다 어떤 위치에서 사용자는, 아마는 C:fileyseract-ocr. Tesseract 개발자의 허가 없이 위 키 페이지의 제목을 변경 하지 마십시오. Tesseract는 명령 줄 프로그램 이므로 먼저 터미널 또는 명령 프롬프트를 엽니다.

이 명령은 다음과 같이 사용 됩니다: 소스 포지에 다운로드 아카이브. 거기 당신은 다른 파일 중, 이전 버전 3.02에 대 한 Windows 설치 프로그램을 찾을 수 있습니다. Tesseract 많은 리눅스 배포판에서 직접 사용할 수 있습니다. 이 패키지는 일반적으로 ` tesseract ` 또는 ` 차원 `-그것을 찾기 위해 배포판의 저장소를 검색 합니다. 따라서 당신은 Tesseract를 설치할 수 있습니다 4. x 그리고 그것은 우분투에 개발자 도구 18. 단순히 실행 하 여 x 슈퍼맨: Tesseract는 아파치 2.0 라이센스에서 사용할 수 있는 오픈 소스 텍스트 인식기 (OCR) 엔진. 직접 사용 하거나 (프로그래머의 경우) API를 사용 하 여 이미지에서 인쇄 된 텍스트를 추출할 수 있습니다.