2009-07-13 40 views
6

Tôi cần phát triển ứng dụng iPhone nhận dạng giọng nói và dựa trên kết quả nó thực hiện các tác vụ khác.Nhận dạng giọng nói trên iPhone

Tôi biết iPhone 3.0 không hỗ trợ nhận dạng giọng nói và tôi cần triển khai phần mềm nhận dạng giọng nói ở phía máy chủ. Tôi chỉ biết điều này, vì tôi là người mới, tôi không biết phải đối phó với điều đó như thế nào.

Có nghĩa là phần mềm nào tôi cần mua và triển khai ở phía máy chủ và cách sử dụng Dịch vụ đó ??

+0

bạn có ý nghĩa gì với phía máy chủ? – Shimmy

+1

Anh ấy có nghĩa là "không phải trên điện thoại". Nó có thể giúp xác định nếu có một hệ điều hành máy chủ cụ thể bạn phải sử dụng mặc dù. –

+0

Phía máy chủ nghĩa là gửi dữ liệu âm thanh đến máy chủ, nhận dạng lời nói ở đó (sử dụng nhiều tài nguyên và bộ nhớ) và gửi kết quả văn bản kết quả về điện thoại. Google làm điều đó với OCR và dịch máy trên Android, ví dụ: Chụp một số văn bản nước ngoài, nó gửi nó đến máy chủ, OCR và dịch nó sang tiếng Anh và gửi kết quả văn bản trở lại. – Frank

Trả lời

1

Tôi không nghĩ rằng có nhiều bộ phần mềm nhận dạng giọng nói phía máy chủ. Các phiên bản mã nguồn mở dường như hầu như không tồn tại. Bạn có thể muốn có một cái nhìn tại SDK này mặc dù:

http://www.scribd.com/doc/17247334/Creaceed-Releases-iPhone-Speech-Recognition-SDK http://www.creaceed.com/weblog/ceedvocalsdk.html

Nó có thể cho phép bạn làm những gì bạn muốn trên iPhone chính nó.

+0

không có liên kết nào hoạt động ( – Dmitry

7

Gói nhận dạng giọng nói nguồn mở tốt nhất mà tôi biết là Sphinx.
http://cmusphinx.sourceforge.net/

Nếu không, tôi khuyên bạn nên xem xét phần mềm Nuance.

Nhận dạng giọng nói hiện tại hoạt động tốt với tập hợp ngữ pháp giới hạn (nếu bạn biết họ định nói gì). Open dictation vẫn chưa hoạt động tốt đủ để được sử dụng đáng tin cậy cho nhiều ứng dụng. Hãy ghi nhớ điều đó khi phát triển ứng dụng của bạn. Tôi hy vọng rằng Google đang tham gia trò chơi phiên mã (với Google Voice) nên bắt đầu cải thiện. Tôi nghĩ rằng họ có thể sẽ có một cái gì đó trong tương lai.

+3

[poketsphinx] (https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/branches/pocketsphinx-0.6/pocketsphinx/) – clyfe

1

Nhận quyền nhận dạng giọng nói là rất phức tạp và một khu vực nghiên cứu đang hoạt động.

Có một số giải pháp nguồn mở ngoài kia, mặc dù, xem here. Một bổ sung, mới là SCARF, nhưng tôi không biết nếu điều đó đã sẵn sàng để sử dụng hay đúng hơn là một bằng chứng về khái niệm.

Các vấn đề liên quan