Tôi đang làm việc để đọc thông tin thẻ nhận dạng bằng thư viện Tesseract. Tôi đã thử sử dụng một số Google images và có kết quả tốt, nhưng khi tôi đã đi đến hình ảnh thời gian thực, đó là khi hình ảnh được chụp từ một máy ảnh iPhone, tôi đã không nhận được kết quả tốt.Cải thiện các bước xử lý trước trong Tesseract OCR để ghi lại thời gian thực
Tôi đã tìm thấy một số bước xử lý trước do Tesseract đề xuất.
1. Sửa DPI (nếu cần) 300 DPI tối thiểu.
Làm cách nào tôi có thể đặt DPI của hình ảnh khi chụp ảnh từ máy ảnh iPhone trong thời gian thực?
2. Chỉnh sửa kích thước văn bản (ví dụ: 12 pt sẽ không sao).
Làm cách nào để sửa kích thước văn bản cho hình ảnh lớn do máy ảnh iPhone tạo ra?
3. Cố gắng sửa các dòng văn bản (văn bản deskew và dewarp).
Tôi đọc rằng Tesseract áp dụng văn bản dewarp bằng thư viện Leptonica.Đó là dewarp hoặc deskew cần thiết cho văn bản ở giai đoạn tiền xử lý này không?
4. Cố gắng sửa ánh sáng của hình ảnh (ví dụ: không có phần tối của hình ảnh).
Tôi có thể thực hiện chiếu sáng hình ảnh bằng OpenCV không?
5. Ảnh lồng tiếng và khử nhiễu.
Tôi nhận được hình ảnh được binarized kém khi tôi áp dụng ngưỡng hoặc ngưỡng thích ứng cho hình ảnh trong thời gian thực.
Tôi làm cách nào để binarize những hình ảnh thời gian thực này?