2009-04-03 39 views
9

Tôi đang tìm các thuật toán, giấy tờ hoặc phần mềm để tăng cường fax, hình ảnh từ máy ảnh điện thoại di động và các nguồn tương tự khác để dễ đọc và OCR.Thuật toán xử lý/tăng cường hình ảnh cho tài liệu OCR/khả năng đọc?

Tôi chủ yếu quan tâm đến các cải tiến đơn giản (ví dụ: những việc bạn có thể làm bằng ImageMagick), nhưng tôi cũng quan tâm đến các kỹ thuật phức tạp hơn. Tôi đã nói chuyện với các nhà cung cấp, vì vậy đối với câu hỏi này, tôi chủ yếu tìm kiếm các thuật toán hoặc phần mềm nguồn mở.

Để làm rõ thêm: Tôi không tìm kiếm phần mềm hoặc thuật toán OCR; Tôi đang tìm các thuật toán để làm sạch hình ảnh để nó trông dễ đọc hơn đối với mắt người, và có thể được sử dụng cho OCR.

Trả lời

5

Tôi đã có một vấn đề tương tự khi tôi đã viết một số phần mềm để làm quét cuốn sách; trôi nổi trên internet là một chương trình gọi là pagetools làm thẳng các trang được quét bằng cách sử dụng một mẹo toán học khá thông minh được gọi là phép biến đổi Radon.

Tôi cũng đã viết một quy trình nhỏ sẽ làm trắng không gian trống trên trang; Thuật toán OCR có xu hướng hoạt động tốt hơn nhiều khi chúng không phải đối mặt với nhiễu nền. Những gì tôi đã làm, là tìm những điểm ảnh có màu sáng hơn bán kính nhỏ so với những điểm có màu tối, và sau đó đẩy chúng lên thành màu trắng tinh khiết.

Đã một vài năm, do đó, tôi không có chi tiết triển khai chính xác tiện dụng.

4

Một bộ lọc hình ảnh đơn giản để xem xét là "Bộ lọc trung bình" rất đơn giản, dễ thực hiện, lọc để giúp làm sạch văn bản được quét/chụp ảnh. http://en.wikipedia.org/wiki/Median_filter

Các vấn đề liên quan