Tôi có hình ảnh sau đây mà tôi muốn để chuẩn bị cho một OCR với Tesseract: sạch lên một hình ảnh cho OCR với ImageMagick và 'textcleaner'
Mục tiêu là để làm sạch hình ảnh và loại bỏ tất cả của tiếng ồn. Tôi đang sử dụng các tập lệnh textcleaner
sử dụng ImageMagick với các thông số sau:
./textcleaner -g -e normalize -f 30 -o 12 -s 2 original.jpg output.jpg
Kết quả vẫn không phải là quá sạch:
Tôi đã thử tất cả các loại biến thể cho các thông số nhưng với không may mắn. Có ai có ý tưởng không?
Cảm ơn bạn rất nhiều, chỉ bằng cách chuyển đổi jpg trong png tạo sự khác biệt tuyệt vời cho tôi, cảm ơn bạn rất nhiều, biết kịch bản tesseract của tôi là tốt hơn nhiều! –