2011-12-20 53 views
7

Tôi đã tìm kiếm trên mạng, vì tôi có chút n00b khi nói đến OCR và tôi thực sự không chắc chắn điểm khởi đầu tốt sẽ được.Làm thế nào để lập trình đọc trên một tài liệu hoặc hình ảnh được quét

Tôi muốn xây dựng một ứng dụng có thể xác định số & nói ví dụ bao nhiêu hộp kiểm được điền vào bất kỳ hàng nào của tài liệu/hình ảnh (thậm chí có thể là định dạng khác tốt hơn nên áp dụng loại này). mục tiêu cuối cùng là loại bỏ việc thu thập dữ liệu thủ công và tăng tốc quá trình nhận được số liệu thống kê tổng thể cho người dùng cuối của ứng dụng

Tôi viết mã bằng C# chủ yếu, vì vậy giải pháp .net sẽ thích hợp hơn, nhưng nếu không tôi ' sẽ lấy những gì tôi có thể nhận được.

Điều tôi đã lưu ý là thiết kế lại các biểu mẫu mà người dùng điền vào một cái gì đó tương tự như thế này. (xin lỗi nghệ thuật ASCII thô: P) để người điền vào biểu mẫu chỉ phải kiểm tra một giá trị trên giấy.

   | 1 | 2 | 3 | 4 | 5 | 
Product A  | [ ] [ ] [ ] [ ] [x] |  
Product B  | [ ] [ ] [x] [ ] [ ] | 

bất kỳ ý tưởng sẽ được rất nhiều đánh giá cao

Cảm ơn bạn!

Trả lời

6

1) Bạn cũng có thể kiểm tra động cơ OCR miễn phí, nhưng rất có khả năng Tesseract. Nó được viết bằng C++, nhưng bạn có thể sử dụng C# để dễ dàng giao tiếp với nó.

2) Nếu bạn muốn cuộn của riêng mình bằng xử lý hình ảnh, bạn có thể xem bằng cách sử dụng thư viện EmguCV, là trình bao bọc .NET cho OpenCV.

Đã có post gần đây trên thẻ opencv, đã cố gắng giải quyết một vấn đề rất giống với vấn đề của bạn liên quan đến việc phát hiện nhãn hiệu trên thẻ xổ số.

+1

Cảm ơn bạn! (và tất cả những người khác đã trả lời) Tôi sẽ thử đăng một số mã mẫu hoặc thứ gì đó nếu tôi lấy nó và chạy (nếu có ai quan tâm) –

+0

Xin chào Rohan, bạn có thể làm việc này không? – Shiva

2

Bạn có thể thử và sử dụng Office MODI library.

tùy chọn khác là

  1. thư viện OCR thương mại, hoặc
  2. thực hiện logic nhận bitmap riêng của bạn (có thể là khả thi nếu bạn có toàn quyền kiểm soát cách bố trí của những gì đã được quét).
+0

Rất xấu hổ, MODI đã không được chấp nhận trong Office 2010 http://technet.microsoft.com/en-us/library/cc179199.aspx. Nhưng có các lựa chọn thay thế: http://en.wikipedia.org/wiki/Microsoft_Office_Document_Imaging#Alternatives_to_MODI_for_Office_2010_Users – Strillo

2

Nếu tất cả những gì bạn đang làm là tìm kiếm X trong hộp, bạn có thể in biểu mẫu bằng màu xanh nhạt và yêu cầu mọi người đánh dấu các ô bằng bút mực đen.

Bạn chỉ cần quét hình ảnh và tìm kiếm các pixel X màu đen. Chúng phải tương đối dễ tìm, so với dạng xanh nhạt. Các toạ độ x, y đặc biệt trên hình ảnh được quét sẽ tương ứng với câu trả lời và loại sản phẩm tương ứng.

2

Điều bạn cần là Nhận dạng đánh dấu quang (OMR). Nếu bạn đang lập kế hoạch một phần mềm thương mại, hãy xem ABBYY FlexiCapture Engine, đây là một SDK để tích hợp công nghệ thu thập dữ liệu và tài liệu trong các ứng dụng máy chủ, máy tính để bàn và thiết bị di động. Nó không phải là miễn phí, nhưng khi nói đến kinh doanh - nó có thể thêm một giá trị nghiêm trọng cho sản phẩm của bạn.

Bạn cũng có thể sử dụng dịch vụ đám mây - trang web cho phép bạn tải lên hình ảnh và gửi lại cho bạn dữ liệu được OCR.Hãy thử www.ocrsdk.com, đây là SDK OCR dựa trên đám mây được ABBYY giới thiệu gần đây. Nó bây giờ là phiên bản beta nên nó hoàn toàn miễn phí để sử dụng. Nó yêu cầu thiết bị người dùng cuối phải có kết nối internet, nhưng nó hoàn toàn độc lập với sự lựa chọn ngôn ngữ lập trình và tài nguyên thiết bị của người dùng. Có cả hai mẫu mã .NETJava ở dạng github.

Disclamer: i work @ ABBYY.

+0

Hi Nikolay, giải pháp đám mây của ABBYY so với https://ocr.a9t9.com/ của Redmond đối với các bức ảnh điện thoại thông minh như thế nào? (Có trang web nào tôi có thể so sánh không?) –

Các vấn đề liên quan