2014-05-21 59 views
6

Tôi đang cố gắng cài đặt Tesseract-OCR trên máy chủ của mình tuy nhiên khi tôi cài đặt tất cả những gì tôi tin là bản chính xác. Khi tôi cố gắng cài đặt, gói này không được tìm thấyCài đặt Tesseract-OCR trên CentOS 6

Tôi đã thử thêm rpmforge nhưng không có kết quả. Bất kỳ ý tưởng nào từ ai đó đã làm trước hoặc quen thuộc với việc thêm và tìm kiếm thông qua repos?

Trả lời

5

tôi đã sử dụng hướng dẫn này và làm việc một cách chính xác trong Centos

Install libs Tesseract OCR từ các nguồn trong Centos

  1. Tải Leptonica và Teseract nguồn:

    $ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
    $ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

  2. .210
  3. Configure, compile, install libs:

    $ tar xzvf leptonica-1.69.tar.gz
    $ cd leptonica-1,69
    $ ./configure $ make $ sudo make install

    $ tar xzf Tesseract-ocr-3.02.02.tar.gz $ cd Tesseract-3,01 $ ./autogen.sh $ ./configure $ make $ sudo make install $ sudo ldconfig

  4. Tải ngôn ngữ (tiếng Anh) và sao chép vào thư mục tessdata:

    $ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
    $ tar xzf Tesseract-ocr-3.02.eng.tar.gz
    $ sudo cp Tesseract-ocr/tessdata/*/usr/local/share/tessdata

và tận hưởng nó;)

+0

nhận được điều này trong linux redhad ./configure $ make $ sudo make install cấu hình: CẢNH BÁO: bạn nên sử dụng --build, --host, --target cấu hình: CẢNH BÁO: loại máy chủ không hợp lệ: $ cấu hình: CẢNH BÁO: bạn nên sử dụng cấu hình --build, --host, --target : CẢNH BÁO: bạn nên sử dụng cấu hình --build, --host, --target : CẢNH BÁO: loại máy chủ không hợp lệ: $ kiểm tra loại hệ thống xây dựng ... Cấu hình không hợp lệ '$ ': máy' $' không được nhận dạng cấu hình: lỗi:/bin/sh config/config.sub $ không thành công – Aadam

+0

Liên kết https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02. 02.tar.gz và http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz cho 404 –

+0

Đối với các liên kết phát hành Tesseract, bạn có thể sử dụng p này tuổi: https://github.com/tesseract-ocr/tesseract/releases –

4

Tôi khuyên bạn nên thử cài đặt từ vòng/phút tại đây: http://pkgs.org/download/tesseract Ngoài ra còn có một số phụ thuộc: libpng-devel, libjpeg-devel, libtiff-devel, zlib và leptonica. Cuối cùng 2 cũng có thể được tìm thấy trên trang web RPM

-4

Tôi đã kết thúc chuyển sang Ubuntu. Tesseract được hỗ trợ đẹp mắt và cài đặt mà không có vấn đề.

apt-get install tesseract-ocr 
+3

anh ấy nói rõ ràng Centos 6, không phải Ubuntu ... – KnF

+0

Vâng, tôi biết. Và CentOS cũng là lựa chọn đầu tiên của tôi, nhưng sau khi giao dịch với một cài đặt rất đau đớn, tôi nghĩ tôi sẽ chia sẻ cách giải quyết của mình. Việc cài đặt Ubuntu chỉ đơn giản là cực kỳ đơn giản. –

+1

Ồ, tôi thấy .. mặc dù cá nhân tôi đánh giá cao sự đóng góp của bạn (vì lý do duy nhất bạn dành một vài giây thời gian của bạn để giúp đỡ người khác) nó vẫn không phải là một câu trả lời hợp lệ. Nhưng xin vui lòng, không làm cho tôi sai, tôi không chỉ trích bạn hoặc câu trả lời của bạn, chỉ là đôi khi mods đóng câu hỏi ban đầu do câu trả lời không chính xác như thế này. Và một lần nữa, cảm ơn bạn đã dành thời gian để trả lời, tôi đoán tất cả các cộng đồng đánh giá cao điều này. – KnF

3

này đã làm việc cho tôi:

/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch 

Tesseract không có trong kho EPEL nhưng trong repo phù thủy EPEL-thử nghiệm không được kích hoạt theo mặc định.

2

tôi đã viết một kịch bản bash để cài đặt Tesseract 3,05 trên Centos 7. Điều này tìm nạp và cài đặt tất cả các phụ thuộc và cũng cài đặt các tệp ngôn ngữ cho tiếng Anh, tiếng Hindi, tiếng Bengali và tiếng Thái.

Mã có sẵn trên GitHub

https://github.com/EisenVault/install-tesseract-redhat-centos

Hope this helps.

Các vấn đề liên quan