2009-12-15 45 views
5

Tôi đang xem xét phát triển một ứng dụng có thể hưởng lợi từ việc có hệ thống nhận dạng hình ảnh. Tôi đã nhìn thấy loại điều này trong các ứng dụng iPhone và Android. Chụp ảnh một cuốn sách và ứng dụng đưa bạn đến Amazon nơi bạn có thể tìm thấy cuốn sách đó. Tôi không tìm kiếm nhận dạng hình ảnh chung, nhưng nhiều khả năng chọn một hình ảnh duy nhất trong thư viện có hình ảnh khoảng 10k.Nhận dạng hình ảnh cho Android/iPhone

Bất kỳ ý tưởng nào về dịch vụ nào có sẵn cho loại điều này?

+0

Nhận dạng hình ảnh là một trường con lớn của Computer Vision, nó sẽ giúp bạn biết nhiều hơn về loại vấn đề bạn định giải quyết trước khi đưa ra các khuyến nghị về thuật toán chính xác. giải quyết các vấn đề trong một miền cụ thể nào đó). – JasonWyatt

+0

Những gì tôi thực sự tìm kiếm là khả năng chụp ảnh thẻ chơi từ các trò chơi thẻ kinh doanh phổ biến, như Magic the Gathering, và kéo dữ liệu lên thẻ, hoặc có lẽ là giá từ cơ sở dữ liệu. Tôi muốn khả năng người dùng sử dụng camera điện thoại di động để chụp ảnh thẻ và sau đó kéo dữ liệu của thẻ đó ra khỏi cơ sở dữ liệu. Vì vậy, tất cả hình ảnh sẽ là 2D. Và tập dữ liệu sẽ khá nhỏ, khoảng 10k tùy chọn hoặc hơn. –

Trả lời

1

Google Goggles thực hiện điều gì đó tương tự như Ghi nhớ của Amazon. Nó sử dụng OCR nếu văn bản có thể được xác định và họ muốn sử dụng nó với tìm kiếm hình ảnh tương tự từ Google Images. Tôi nghĩ rằng họ tạo ra một số loại băm cho một hình ảnh với các tính năng mà nếu những hình ảnh tương tự như những hình ảnh tương tự như.

phỏng đoán tốt nhất của tôi sẽ cố gắng bắt đầu với nhận dạng ký tự và thực hiện tìm kiếm văn bản cho tiêu đề thẻ của bạn. Điều này có nghĩa là người dùng của bạn phải tạo một hình ảnh rất rõ ràng ngay cả ở một vị trí cụ thể. Nhưng đối với một ứng dụng đầu tiên này sẽ là tuyệt vời rồi. Khi ai đó chơi ma thuật, tôi sẽ mua công cụ để giao dịch và lập danh mục thẻ của tôi.

+0

Đó là một ý tưởng tuyệt vời ... Tôi không nghĩ về phần công nhận OCR của nó. Điều đó chắc chắn sẽ đơn giản hóa mọi thứ và cho phép người dùng không phải có toàn bộ thẻ trong hình ảnh. –

1

Thực ra, trong khi thiếu nhân viên Amazon thực sự để nói với bạn rằng không có cách nào để xác nhận điều này, tôi khá chắc chắn rằng tính năng Amazon Remembers mà bạn đề cập đến thực sự là công việc của đám đông tìm kiếm- sử dụng rất nhiều người chải thông qua dữ liệu để làm cho nó xuất hiện như một máy tính đang làm nó. Tôi nghĩ rằng họ thực sự có thể sử dụng hệ thống Mechanical Turk ở đó.

Chỉnh sửa: Ngoài ra, tôi đã tìm thấy this SO question mà bạn có thể quan tâm. Nó đặc biệt để chơi bài, nhưng một số câu trả lời (ví dụ như ví dụ học máy) có thể được sửa đổi để giúp ích hơn cho những gì bạn muốn làm với thẻ ma thuật.

+0

Cũng xem xét rằng toàn bộ quá trình mất ít hơn 10 giây ... Tôi nghi ngờ điều này là nó. Vào thời điểm hình ảnh được truyền đến Amazon, và trang mới được gửi lại, chúng tôi đang xem xét khoảng 1-2 giây trong thời gian xử lý, đó sẽ là một Turk nhanh. –

+0

Nếu bạn chụp ảnh một cái gì đó với một tiêu đề rõ ràng trên nó (có thể được xác định evewn bởi một con người trong thời gian gần như không có), có nó chỉ mất 10 giây. Đã cố gắng chụp ảnh một mục ngẫu nhiên, phải mất nhiều thời gian hơn. Ngoài ra, google Amazon Remembers và Mechanical Turk, bạn sẽ tìm thấy số truy cập mà mọi người đã thử nghiệm hệ thống và xác nhận rằng ít nhất một số thời gian họ đang sử dụng hệ thống Cơ Turk. Amazon chưa bao giờ nói cách họ làm Amazon nhớ, vì vậy nó là một đoán. Điểm duy nhất của tôi là ít nhất một phần của những gì amazon nhớ là giả, vì vậy họ có thể không phải là ví dụ tốt nhất. –

Các vấn đề liên quan