Chẳng gì bằng bộ tốt nhất. Hãy nhớ rằng hình ảnh kỹ thuật số có thể được thu thập bởi các thiết bị chụp khác nhau và mỗi thiết bị có thể nhúng hệ thống tiền xử lý riêng (bộ lọc) và các đặc điểm khác có thể thay đổi hình ảnh và thậm chí thêm tiếng ồn cho chúng. Vì vậy, mọi trường hợp sẽ phải được xử lý (được xử lý trước) khác nhau.
Tuy nhiên, có hoạt động commmon có thể được sử dụng để cải thiện việc phát hiện, ví dụ, một rất cơ bản sẽ được chuyển đổi hình ảnh sang màu xám và áp dụng một threshold để binarize hình ảnh. Một kỹ thuật khác mà tôi đã sử dụng trước đây là the bounding box, cho phép bạn phát hiện vùng văn bản. Để loại bỏ tiếng ồn từ hình ảnh, bạn có thể quan tâm đến hoạt động xói mòn/giãn nở. Tôi trình bày một số hoạt động này trên this post.
Ngoài ra, có những bài viết thú vị khác về OCR và OpenCV mà bạn nên có một cái nhìn:
Bây giờ, chỉ để cho bạn thấy một cách tiếp cận đơn giản mà có thể được sử dụng với hình ảnh mẫu của bạn, đây là kết quả của việc đảo ngược màu và áp dụng ngưỡng:
cv::Mat new_img = cv::imread(argv[1]);
cv::bitwise_not(new_img, new_img);
double thres = 100;
double color = 255;
cv::threshold(new_img, new_img, thres, color, CV_THRESH_BINARY);
cv::imwrite("inv_thres.png", new_img);
bạn có thể tải lên các hình ảnh mẫu đó tại đây không? liên kết cho 403 bị cấm – Alupotha