Tôi muốn phát hiện các số tiếng Anh cơ bản từ 0 đến 9 bằng OCR đơn giản trên Android. Tôi đã tìm OCR cho Android, nhưng nó quá phức tạp cho mục đích chính của tôi, có cách nào đơn giản hơn để phát hiện số trên Android không?Cách tốt nhất để thực hiện nhận dạng số cơ bản là gì?
Trả lời
Cách thay thế đơn giản là xác định trước các chữ số dưới dạng bitmap và tìm chúng bằng cách sử dụng mối tương quan chéo chuẩn hóa.
Có rất nhiều nhược điểm trong phương pháp này:
- Không mạnh mẽ để phông chữ khác nhau
- Không mạnh mẽ quy mô của số
- ...
Nhưng có lẽ đó là những gì bạn chỉ cần bắt đầu.
Nếu bạn muốn thực hiện OCR từ máy ảnh dựa trên điện thoại, sẽ khó sử dụng bitmap được xác định trước: ảnh sẽ được chụp với tỷ lệ khác nhau, chúng sẽ chứa tiếng ồn, chúng sẽ được scewed v.v. hầu như không đủ chính xác.
Nếu bạn đang phát triển một ỨNG DỤNG Android, rất có thể bạn đang sử dụng Java. Tin xấu ở chỗ không có Java OCR SDK nguồn mở nào. Có các API Java bao bọc các cuộc gọi cho các giao diện nguyên gốc, ví dụ, cho một trong những công cụ OCR mã nguồn mở phổ biến nhất - Tesseract (http://groups.google.com/group/tesseract-ocr/) - có một số trình bao bọc Java như tesjeract (http://code.google.com/p/tesjeract/) hoặc Tess4J (http://tess4j.sf.net/). Điều đó có thể làm việc cho bạn, nhưng nó khá khó để thiết lập và sẽ yêu cầu phát triển tiền xử lý hình ảnh và đào tạo phông chữ ở bên cạnh bạn.
Một giải pháp khác có thể là dịch vụ đám mây. Nó đòi hỏi ứng dụng người dùng cuối phải có kết nối internet, nhưng nó độc lập với lựa chọn ngôn ngữ lập trình và các hạn chế về tài nguyên của bạn. Hãy xem ABBYY Cloud OCR SDK, đây là SDK OCR dựa trên đám mây được ABBYY giới thiệu gần đây. Đó là phiên bản beta, vì vậy hiện tại nó hoàn toàn miễn phí để sử dụng và nó đã sẵn sàng để đi Android code samples. Nó có hình ảnh chế biến sẵn được xây dựng trong, không yêu cầu đào tạo và chỉ đơn giản là làm việc ra khỏi hộp - bạn chỉ cần gửi và hình ảnh và nhận dữ liệu ocr-ed. Ngoài ra, nó còn có chức năng nhận dạng mức trường có thể giúp bạn tiết kiệm một phần tài nguyên xử lý thiết bị nhỏ có giá trị. Tôi làm việc @ ABBYY và có thể cung cấp cho bạn thông tin bổ sung về các sản phẩm của chúng tôi nếu cần.
- 1. Cách tốt nhất để thực hiện "hẹn giờ" là gì?
- 2. Trong C#, cách tốt nhất/được chấp nhận để thực hiện chuỗi hàm tạo là gì?
- 3. Cách tốt nhất để thực hiện tìm/thay thế trong một số tệp là gì?
- 4. Cách tốt nhất để thực hiện sao lưu tự động là gì?
- 5. Cách tốt nhất để thực hiện xác thực đầu vào trong C++ bằng cin là gì?
- 6. Cơ sở dữ liệu "tốt nhất" để nhúng là gì?
- 7. nhibernate: thực tiễn tốt nhất để thực hiện bình đẳng là gì?
- 8. Cách tốt nhất để cập nhật dữ liệu cơ bản của Adapter là gì?
- 9. Cách tốt nhất để thiết kế kịch bản cơ sở dữ liệu này là gì?
- 10. Cách tốt nhất để thực hiện jQuery là gì. Thay đổi()
- 11. Cách tốt nhất để định dạng số điện thoại bằng Python là gì?
- 12. Whats cách tốt nhất để cấu hình cơ sở dữ liệu sqlserver 2005 để thực hiện là gì?
- 13. Cách tốt nhất để phát hiện màu trắng là gì?
- 14. Cách tốt nhất để thực hiện yêu cầu điều chỉnh trong ASP.NET MVC là gì?
- 15. Cách tốt nhất để thực hiện phân nhánh bằng cách sử dụng Intel SSE là gì?
- 16. Cách tốt nhất để thực hiện các giao thức là gì?
- 17. Cách tốt nhất để thực hiện thao tác Bit Field bằng Python là gì?
- 18. Cách tốt nhất để theo dõi số nhận dạng của bạn cho Jquery và CSS của bạn là gì?
- 19. Cách tốt nhất để tạo lớp không thể thực hiện được là gì?
- 20. Cách tốt nhất để thực hiện chuỗi con trong tập tin batch là gì?
- 21. API nhận dạng giọng nói tốt nhất hiện tại cho ios để khớp với vài từ khóa là gì?
- 22. Một số cách tốt để thực hiện khóa liên thông là gì?
- 23. Cách tốt nhất để thực hiện mã hóa 2 chiều bằng PHP là gì?
- 24. Cách tốt nhất để thực hiện phân trang ajax với MongoDb và Nodejs là gì?
- 25. Cách tốt nhất để thể hiện số lượng lớn tùy ý trong c là gì?
- 26. Cách tốt nhất để phân tích chuỗi là gì?
- 27. Cách thành ngữ thực hiện chuyển đổi/định dạng "số nguyên" trong javascript là gì?
- 28. Cách tốt nhất để lưu trữ/tính toán điểm số của người dùng là gì?
- 29. Cách tốt nhất để so sánh 2 biến thể của truy vấn SQL để thực hiện là gì?
- 30. Trong jQuery, cách tốt nhất để định dạng số thành 2 chữ số thập phân là gì?
Bạn có cần OCR chúng từ máy ảnh dựa trên điện thoại không? – Nikolay
@Nikolay Vâng, tôi cần điều đó. –