2011-02-03 34 views
9

Tôi cần nhận dạng số từ hình ảnh camera trên iPhone, trong thời gian thực. Tôi biết sẽ không có nhiều hơn 5 chữ số trên hình ảnh.Nhận dạng số trên iPhone có thể trong thời gian thực không?

Vấn đề này có thực tế để giải quyết được các đặc tính tính toán của iPhone không? Có ai có kinh nghiệm sử dụng thư viện Tesseract OCR không, và bạn có nghĩ rằng nó có thể được giải quyết bằng cách sử dụng nó?

+0

thể trùng lặp của: http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone –

+0

@Daniel: Trong khi câu hỏi đó hỏi làm thế nào để sử dụng Tesseract để đọc các số trong bất kỳ hình ảnh tĩnh nào, điều này đang nghiên cứu khả năng thực hiện loại xử lý này từ luồng video trực tiếp. Tôi tin rằng có đủ sự khác biệt ở đây để biện minh cho một câu hỏi mới. –

Trả lời

1

Tính toán phải khả thi. Có các ứng dụng có thể nhận mã vạch trong thời gian thực và cũng là một ứng dụng thực hiện dịch thời gian thực. (Word Lens). Tôi không chắc chắn những thư viện mà họ sử dụng, tuy nhiên.

11

Phụ thuộc vào định nghĩa "thời gian thực", nhưng có, bạn có thể thực hiện tương đối nhanh chỉ với các chữ số 0-9 trên iPhone 4, đặc biệt nếu bạn có phông chữ, điều kiện ánh sáng, v.v. mà họ sẽ xuất hiện.

Tôi khuyên bạn nên đọc bài viết trên how Sudoku Grab does its recognition of puzzles bằng camera iPhone. Trong trường hợp của họ, một mạng thần kinh được huấn luyện đã được sử dụng để xác định các chữ số, nên đơn giản và nhanh chóng hợp lý trên phần cứng iOS hiện đại.

Các thư viện nhận dạng hiện tại ngoài đó, như OpenCV, sẽ sử dụng CPU của iPhone để thực hiện quá trình xử lý. Tôi đã nghe nói rằng họ có thể thực hiện các tác vụ phức tạp hơn như nhận diện khuôn mặt đủ nhanh để sử dụng với các nguồn video trong khi hiển thị số lần nói lắp tối thiểu.

Để có hiệu suất tốt hơn nữa, tôi tin rằng có rất nhiều tiềm năng trong GPU có thể lập trình trên các thiết bị iOS mới hơn. Trong my benchmarks, tôi thấy tốc độ 14X - 28X khi sử dụng GPU của iPhone 4 để xử lý hình ảnh đơn giản. Trong khi rất ít người đang xem xét điều này ngay bây giờ, một thứ như mạng thần kinh của Sudoku Grab phải là một quá trình đủ song song để hưởng lợi từ việc chạy trên GPU.

+0

Công việc hữu ích http://www.benjaminloulier.com – iCoder86

0

Yes. Bender có thể giúp bạn với điều đó. Nó cho phép bạn xây dựng và chạy các mạng thần kinh trên iOS. Vì nó sử dụng kim loại dưới mui xe, nó chạy nhanh và mượt mà. Nó cũng hỗ trợ chạy các mô hình TensorFlow trực tiếp.

Vì vậy, bạn có thể chạy trong Bender một mô hình hiện tại TensorFlow đào tạo công nhận chữ số Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras nếu bạn cần giúp đỡ

Disclaimer: Tôi làm việc trên dự án này.

0

Có SDK miễn phí cho điều đó: http://rtrsdk.com/ Hỗ trợ cả iOS và Andorid, hoạt động trong thời gian thực, giúp bạn nắm bắt bất kỳ văn bản nào, số điện thoại không phải là vấn đề.

Disclaimer: Tôi làm việc cho ABBYY

Các vấn đề liên quan