2010-11-15 37 views
15

Tôi muốn hệ thống nhận dạng giọng nói của Android phân tích tệp âm thanh chứ không phải là giọng nói đến mặc định từ micrô.Có cách nào để gửi tệp âm thanh đến nhận dạng giọng nói thành văn bản

Có cách nào để làm điều đó không?

Cảm ơn bạn.

+0

Tôi thấy liên kết này: http://www.androidjavadoc.com/1.0_r1_src/android/speech/recognition/MediaFileReader.html có vẻ thú vị nhưng hiện tại tôi không thể tham khảo lớp này ... – nonozor

+0

bạn có thể làm điều này bằng cách ghi âm đầu tiên từ micro sau đó lưu tệp dưới dạng mảng byte vào thời gian chạy sau đó giải mã tệp này từ mảng byte thành tệp định dạng âm thanh và nhập vào hệ thống nhận dạng giọng nói. –

Trả lời

1

Tôi cho rằng nó hoạt động theo một cách tương tự như api chrome - http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

Như ông đã nói, bạn có thể chuyển đổi các tập tin microphone vào một file .flac và gửi nó vào api ngôn luận, và bạn sẽ nhận được cùng một kết quả. Vì vậy, bạn có thể sử dụng SOX và tự chuyển đổi nó.

Hy vọng điều đó sẽ hữu ích. Dias

+0

Điều đó không còn hiệu quả nữa, họ đã lấy API –

1

cmusphinx.sourceforge.net/wiki/tutorialandroid Chỉ tìm thấy liên kết đó có vẻ như ai đó đã tạo phiên bản Sphinx trên Android.

Nhìn vào api Android, việc này dường như không được hỗ trợ. (http://developer.android.com/reference/android/speech/package-summary.html)

Bạn có thể sử dụng API khác.

Tôi biết rằng C# api của Microsoft cho phép điều này nhưng để có thể hữu ích, bạn có thể cần thiết lập máy chủ bằng chương trình bạn đã ghi tệp âm thanh trên điện thoại rồi gửi cho máy chủ.

CMUSphinx (http://cmusphinx.sourceforge.net/wiki/) được viết bằng Java để có thể chạy nó trên thiết bị Android. Trên api đó bạn tạo một StreamSpeechReconizer.

StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration); 
recognizer.startRecognition(new File("speech.wav").toURI().toURL()); 
SpeechResult result = recognizer.getResult(); 
recognizer.stopRecognition(); 

tôi thấy https://gist.github.com/alotaiba/1730160 này với một tìm kiếm trên web nhanh chóng (google "nhận dạng giọng nói api chấp nhận tập tin") để có thể có các dịch vụ khác có sẵn trên web mà sẽ chấp nhận một tập tin được gửi cho họ.

Các vấn đề liên quan