2016-12-26 26 views
5

Tôi đang làm việc trên một ứng dụng mà tôi cần tính năng như Cam Scanner nơi tài liệu được phát hiện trong một hình ảnh. Cho rằng tôi đang sử dụng phát hiện Canny Edge tiếp theo Hough Transform.Xóa văn bản trong khi xử lý hình ảnh

Kết quả tìm kiếm đầy hứa hẹn nhưng văn bản trong tài liệu được tạo ra các vấn đề như được giải thích thông qua những hình ảnh dưới đây:

gốc Hình ảnh Original Image

Sau khi phát hiện cạnh khôn ngoan After Canny Edge detcetion

Sau khi hough biến đổi After Hough Transform

Vấn đề của tôi nằm ở hình thứ ba, văn bản trong mage gốc gần phía dưới đã buộc hough biến đổi để phát hiện đường ngang (cụm 2 từ dưới).

Tôi biết mình có thể lấy tứ giác lớn nhất và có thể hoạt động tốt trong hầu hết các trường hợp, nhưng tôi vẫn muốn biết bất kỳ cách nào khác trong quá trình xử lý này tôi có thể bỏ qua tác động của văn bản trên các cạnh.

Mọi trợ giúp sẽ được đánh giá cao.

+0

Vui lòng đính kèm mã có liên quan. – ZdaR

Trả lời

4

Tôi đã giải quyết vấn đề văn bản với sự trợ giúp của bộ lọc trung bình có kích thước 15 (hình vuông) trong hình ảnh có kích thước 500x700.

Bộ lọc trung gian không ảnh hưởng đến ranh giới của bài viết, nhưng có thể giúp loại bỏ hoàn toàn văn bản.

Sử dụng điều đó tôi đã có thể nhận được nhiều ranh giới hiệu quả hơn.

1

Một cách tiếp cận khác mà bạn có thể thử là sử dụng tính năng dập ghim để tìm các ranh giới giấy. Điều này sẽ tạo ra một hình ảnh nhị phân. Sau đó bạn có thể kiểm tra các đốm màu của các điểm ảnh trắng và xem liệu có đủ lớn nào để làm giấy và có kích thước phù hợp hay không. Nếu nó phù hợp với các tiêu chí, bạn có thể tìm thấy các điểm tối thiểu/tối đa của blob này để đại diện cho bài báo.

Có một số cách để thực hiện việc đẩy mạnh, bao gồm lặp lại, otsu và thích ứng.

Ngoài ra, để có kết quả tốt nhất, bạn có thể phải làm giãn hình ảnh nhị phân để đóng các đường màu đen trong bảng như trong ví dụ của bạn.

Các vấn đề liên quan