Tesseract 3 có thể thực hiện phân tích bố cục trang. Tuy nhiên, tôi không thể tìm thấy bất kỳ mã mẫu hoặc tài liệu nào về cách sử dụng thư viện cho các mục đích như vậy. Tôi hy vọng một người nào đó ở đây có thể giải thích cách thực hiện phân tích bố cục trên hình ảnh và cách phân tích cú pháp dữ liệu kết quả.Phân tích bố cục trang bằng Tesseract?
9
A
Trả lời
8
Tesseract có thể nhận được một thông số chế độ trang (-psm
) mà có thể có các giá trị sau:
0
= Định hướng và phát hiện kịch bản (OSD) mà thôi.1
= Phân đoạn trang tự động với OSD.2
= Phân đoạn trang tự động, nhưng không có OSD hoặc OCR3
= Phân đoạn trang hoàn toàn tự động, nhưng không có OSD. (Mặc định)4
= Giả sử một cột văn bản có kích thước biến.5
= Giả sử một khối đơn nhất của văn bản được căn chỉnh theo chiều dọc.6
= Giả sử một khối văn bản thống nhất.7
= Xử lý hình ảnh dưới dạng một dòng văn bản.8
= Xử lý hình ảnh dưới dạng một từ duy nhất.9
= Xử lý hình ảnh dưới dạng một từ trong một vòng tròn.10
= Xử lý hình ảnh dưới dạng một ký tự đơn.
Ví dụ:
tesseract image.tif image.txt -l eng -psm 0
Tuy nhiên, tôi không chắc chắn rằng nó có thể sử dụng phân tích bố trí trong chế độ độc lập.
5
Đầu tiên, khởi tạo TessBaseAPI
phiên bản. Bạn có thể sử dụng Init()
(nếu bạn muốn thực hiện nhận dạng văn bản khác) hoặc InitForAnalysePage()
(nếu bạn chỉ quan tâm đến các hộp văn bản).
Thứ hai, đặt hình ảnh bằng cách sử dụng SetImage()
.
Và cuối cùng, hãy gọi AnalyseLayout()
để nhận PageIterator
cung cấp cho bạn hộp văn bản.
tesseract::TessBaseAPI tessApi;
tessApi.InitForAnalysePage();
// tessApi.SetImage(...);
tesseract::PageIterator *iter = tessApi.AnalyseLayout();
// Instead of RIL_WORD you can use any other PageSegMode
while (iter->Next(tesseract::RIL_WORD)) {
int left, top, right, bottom;
iter->BoundingBox(
tesseract::RIL_WORD,
&left, &top, &right, &bottom
);
}
Các vấn đề liên quan
- 1. Sử dụng agility.js để bố cục trang và bố cục
- 2. Tham chiếu bố cục tệp nhị phân
- 3. thay thế bố cục trên QWidget bằng bố cục khác
- 4. Bố cục MVC VS Trang chủ MVC
- 5. Bố cục thư mục trang web
- 6. Bố cục lát bằng CSS và HTML
- 7. Cập nhật trang động trong bố cục các bố cục lồng nhau
- 8. Viết một bộ ghép Z80 - lexing ASM và xây dựng một cây phân tích bằng cách sử dụng bố cục?
- 9. Cách tạo bố cục này bằng CSS?
- 10. Sử dụng trình phân tích cú pháp bố cục của Trifecta
- 11. thêm bố cục trong bố cục khác
- 12. Bố cục lưới Vs. Bố cục bảng
- 13. Bố cục CSS Tricky
- 14. Bố cục tự động bằng initWithFrame?
- 15. Tích hợp Bố cục SmartGWT trong Vaadin 7
- 16. Tràn với bố cục bố cục tuyệt đối/tương đối
- 17. Bố cục Android S3 và bố cục Galaxy Nexus
- 18. ASP.NET MVC 3 Xem một phần trong trang bố cục
- 19. Lớp bố cục? Trục Z?
- 20. Bố cục in CSS - In trên một trang đơn
- 21. Bố cục bố cục bàn phím ảo trên màn hình
- 22. Bố cục bố cục sai trong cửa sổ bật lên
- 23. bố cục trong expressjs
- 24. Jekyll - Thay đổi bố cục nếu trang là bài đăng?
- 25. Ảnh toàn trang trong bố cục hai cột
- 26. Vấn đề bố cục RTL cho Trang tính (MFC)
- 27. Cách thay đổi bố cục trang danh mục trong Magento?
- 28. Hiệu ứng cuộn tròn trang Android trên bố cục/s
- 29. Cách tạo bố cục Tiêu đề/Nội dung/Chân trang này bằng cách sử dụng CSS?
- 30. Bạn có bắt đầu bố cục trang web bằng mô hình photoshop không?
Câu hỏi về "cách sử dụng thư viện", không phải là tệp thực thi độc lập. –