2015-05-14 14 views
7

Tôi có hình ảnh sau đây mà tôi muốn để chuẩn bị cho một OCR với Tesseract: enter image description heresạch lên một hình ảnh cho OCR với ImageMagick và 'textcleaner'

Mục tiêu là để làm sạch hình ảnh và loại bỏ tất cả của tiếng ồn. Tôi đang sử dụng các tập lệnh textcleaner sử dụng ImageMagick với các thông số sau:

./textcleaner -g -e normalize -f 30 -o 12 -s 2 original.jpg output.jpg 

Kết quả vẫn không phải là quá sạch: enter image description here

Tôi đã thử tất cả các loại biến thể cho các thông số nhưng với không may mắn. Có ai có ý tưởng không?

Trả lời

5

Nếu bạn chuyển sang JPEG, bạn sẽ luôn có các loại hiện vật bạn đang nhìn thấy.

Đây là một "tính năng" điển hình của nén JPEG. Các ảnh JPEG không bao giờ tốt cho các hình ảnh hiển thị các đường nét sắc nét, tương phản với các màu đồng nhất giữa các vùng khác nhau của hình ảnh, chỉ sử dụng rất ít màu. Điều này đúng với các văn bản màu đen + trắng. JPEG chỉ là "tốt" cho các bức ảnh thông thường, với nhiều màu sắc và màu sắc khác nhau ...

Sự cố của bạn rất có thể sẽ được giải quyết nếu bạn sử dụng định dạng đầu ra PNG. Hình ảnh sau đây minh họa điều này. Tôi tạo ra nó với các thông số tương tự như lệnh ví dụ cuối cùng của bạn sử dụng, nhưng với PNG là định dạng đầu ra:

textcleaner -g -e normalize -f 30 -o 12 -s 2 \ 
    http://i.stack.imgur.com/ficx7.jpg  \ 
    out.png 

PNG instead of JPEG output

Đây là một zoom tương tự vào đầu ra:

Zoomed PNG

Bạn rất có thể cải thiện đầu ra nhiều hơn nếu bạn chơi với các tham số của tập lệnh textcleaner. Nhưng đó là công việc của bạn ... :-)

+1

Cảm ơn bạn rất nhiều, chỉ bằng cách chuyển đổi jpg trong png tạo sự khác biệt tuyệt vời cho tôi, cảm ơn bạn rất nhiều, biết kịch bản tesseract của tôi là tốt hơn nhiều! –

Các vấn đề liên quan