2011-12-25 42 views
5

Tôi muốn phát hiện các số tiếng Anh cơ bản từ 0 đến 9 bằng OCR đơn giản trên Android. Tôi đã tìm OCR cho Android, nhưng nó quá phức tạp cho mục đích chính của tôi, có cách nào đơn giản hơn để phát hiện số trên Android không?Cách tốt nhất để thực hiện nhận dạng số cơ bản là gì?

+1

Bạn có cần OCR chúng từ máy ảnh dựa trên điện thoại không? – Nikolay

+0

@Nikolay Vâng, tôi cần điều đó. –

Trả lời

5

Cách thay thế đơn giản là xác định trước các chữ số dưới dạng bitmap và tìm chúng bằng cách sử dụng mối tương quan chéo chuẩn hóa.
Có rất nhiều nhược điểm trong phương pháp này:

  • Không mạnh mẽ để phông chữ khác nhau
  • Không mạnh mẽ quy mô của số
  • ...

Nhưng có lẽ đó là những gì bạn chỉ cần bắt đầu.

3

Nếu bạn muốn thực hiện OCR từ máy ảnh dựa trên điện thoại, sẽ khó sử dụng bitmap được xác định trước: ảnh sẽ được chụp với tỷ lệ khác nhau, chúng sẽ chứa tiếng ồn, chúng sẽ được scewed v.v. hầu như không đủ chính xác.

Nếu bạn đang phát triển một ỨNG DỤNG Android, rất có thể bạn đang sử dụng Java. Tin xấu ở chỗ không có Java OCR SDK nguồn mở nào. Có các API Java bao bọc các cuộc gọi cho các giao diện nguyên gốc, ví dụ, cho một trong những công cụ OCR mã nguồn mở phổ biến nhất - Tesseract (http://groups.google.com/group/tesseract-ocr/) - có một số trình bao bọc Java như tesjeract (http://code.google.com/p/tesjeract/) hoặc Tess4J (http://tess4j.sf.net/). Điều đó có thể làm việc cho bạn, nhưng nó khá khó để thiết lập và sẽ yêu cầu phát triển tiền xử lý hình ảnh và đào tạo phông chữ ở bên cạnh bạn.

Một giải pháp khác có thể là dịch vụ đám mây. Nó đòi hỏi ứng dụng người dùng cuối phải có kết nối internet, nhưng nó độc lập với lựa chọn ngôn ngữ lập trình và các hạn chế về tài nguyên của bạn. Hãy xem ABBYY Cloud OCR SDK, đây là SDK OCR dựa trên đám mây được ABBYY giới thiệu gần đây. Đó là phiên bản beta, vì vậy hiện tại nó hoàn toàn miễn phí để sử dụng và nó đã sẵn sàng để đi Android code samples. Nó có hình ảnh chế biến sẵn được xây dựng trong, không yêu cầu đào tạo và chỉ đơn giản là làm việc ra khỏi hộp - bạn chỉ cần gửi và hình ảnh và nhận dữ liệu ocr-ed. Ngoài ra, nó còn có chức năng nhận dạng mức trường có thể giúp bạn tiết kiệm một phần tài nguyên xử lý thiết bị nhỏ có giá trị. Tôi làm việc @ ABBYY và có thể cung cấp cho bạn thông tin bổ sung về các sản phẩm của chúng tôi nếu cần.

Các vấn đề liên quan