2011-11-13 38 views
9

Tesseract 3 có thể thực hiện phân tích bố cục trang. Tuy nhiên, tôi không thể tìm thấy bất kỳ mã mẫu hoặc tài liệu nào về cách sử dụng thư viện cho các mục đích như vậy. Tôi hy vọng một người nào đó ở đây có thể giải thích cách thực hiện phân tích bố cục trên hình ảnh và cách phân tích cú pháp dữ liệu kết quả.Phân tích bố cục trang bằng Tesseract?

Trả lời

8

Tesseract có thể nhận được một thông số chế độ trang (-psm) mà có thể có các giá trị sau:

  • 0 = Định hướng và phát hiện kịch bản (OSD) mà thôi.
  • 1 = Phân đoạn trang tự động với OSD.
  • 2 = Phân đoạn trang tự động, nhưng không có OSD hoặc OCR
  • 3 = Phân đoạn trang hoàn toàn tự động, nhưng không có OSD. (Mặc định)
  • 4 = Giả sử một cột văn bản có kích thước biến.
  • 5 = Giả sử một khối đơn nhất của văn bản được căn chỉnh theo chiều dọc.
  • 6 = Giả sử một khối văn bản thống nhất.
  • 7 = Xử lý hình ảnh dưới dạng một dòng văn bản.
  • 8 = Xử lý hình ảnh dưới dạng một từ duy nhất.
  • 9 = Xử lý hình ảnh dưới dạng một từ trong một vòng tròn.
  • 10 = Xử lý hình ảnh dưới dạng một ký tự đơn.

Ví dụ:

tesseract image.tif image.txt -l eng -psm 0 

Tuy nhiên, tôi không chắc chắn rằng nó có thể sử dụng phân tích bố trí trong chế độ độc lập.

+0

Câu hỏi về "cách sử dụng thư viện", không phải là tệp thực thi độc lập. –

5

Đầu tiên, khởi tạo TessBaseAPI phiên bản. Bạn có thể sử dụng Init() (nếu bạn muốn thực hiện nhận dạng văn bản khác) hoặc InitForAnalysePage() (nếu bạn chỉ quan tâm đến các hộp văn bản).

Thứ hai, đặt hình ảnh bằng cách sử dụng SetImage().

Và cuối cùng, hãy gọi AnalyseLayout() để nhận PageIterator cung cấp cho bạn hộp văn bản.

tesseract::TessBaseAPI tessApi; 
tessApi.InitForAnalysePage(); 

// tessApi.SetImage(...); 

tesseract::PageIterator *iter = tessApi.AnalyseLayout(); 

// Instead of RIL_WORD you can use any other PageSegMode 
while (iter->Next(tesseract::RIL_WORD)) { 
    int left, top, right, bottom; 

    iter->BoundingBox(
      tesseract::RIL_WORD, 
      &left, &top, &right, &bottom 
    ); 
} 
Các vấn đề liên quan