2011-09-22 25 views

Trả lời

9

Có một loạt các librariers IOS thương mại để nhận dạng giọng nói. Những cái tên tôi tiếp tục nghe là Nuance, iSpeech, và Yapme. Mỗi tính năng nhận dạng giọng nói trên đám mây (tắt thiết bị) và thư viện ứng dụng và SDK để tích hợp vào ứng dụng của bạn.

Nuance dường như ủng hộ Tây Ban Nha - http://blog.dragonmobileapps.com/2011/01/mobile-app-developer-dragon-mobile-sdk.html

... bạn có thể giọng nói cho phép ứng dụng của bạn bao gồm cả Mỹ và Anh Anh, châu Âu Tây Ban Nha, châu Âu Pháp, Đức, Ý và Nhật Bản --- với thậm chí nhiều ngôn ngữ hơn trên máy cho năm 2011!

và bây giờ Nuance cung cấp cho các nhà phát triển tự do truy cập - http://www.masshightech.com/stories/2011/09/26/daily13-Nuance-tweaks-mobile-dev-program-with-free-access-to-Dragon.html

iSpeech là khả năng hỗ trợ Tây Ban Nha - http://www.ispeech.org/developers/iphone

SDK Mobile iSpeech của hỗ trợ 27 TTS và ASR (được định nghĩa ngữ pháp) ngôn ngữ và 15 ngôn ngữ để nhận dạng giọng nói dạng tự do.

Yapme, xin lỗi, tôi không chắc chắn - http://yapinc.com/speech-cloud.html

4

Hãy xem ở đây: http://src.chromium.org/viewvc/chrome/trunk/src/content/browser/speech/

Đó là Trình duyệt Chrome Speech để tìm kiếm ...... bạn có thể làm điều đó trong mục tiêu-C. Hãy thử truy cập google.com trên trình duyệt chrome và nếu tiếng Tây Ban Nha được công nhận, bạn sẽ thắng! :)

Bạn có thể dễ dàng sử dụng:

- (void) SpeechFromGooglezzz { 
    NSURL *url = [NSURL URLWithString:@"https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=en-US"]; 

    ASIFormDataRequest *request = [ASIFormDataRequest requestWithURL:url]; 
    NSString *filePath = [NSString stringWithFormat:@"%@%@", [[NSBundle mainBundle] resourcePath], @"tmpAudio.flac"]; 

    NSData *myData = [NSData dataWithContentsOfFile:filePath]; 
    [request addPostValue:myData forKey:@"Content"]; 
    [request addPostValue:@"audio/x-flac; rate=16000" forKey:@"Content-Type"]; 
    [request startSynchronous]; 

    NSLog(@"req: %@", [request responseString]); 
} 

Hãy nhớ rằng bạn phải ghi một tập tin FLAC 16000 bitrate! Hoặc không có gì!

Google trả lời bằng một câu trả lời có chứa các từ.

hy vọng điều này sẽ hữu ích.

+0

Sự hiểu biết của tôi là Google không cung cấp các dịch vụ này cho mục đích thương mại ngoại trừ khách hàng Chrome và Android. Tôi sẽ không xây dựng một ứng dụng thương mại bằng cách sử dụng các API đó từ IOS. Google có thể dễ dàng tắt ứng dụng của bạn. Nếu nó chỉ là một mẫu thử nghiệm hoặc thử nghiệm, bạn có thể lấy đi bằng cách sử dụng các dịch vụ của Google, nhưng tôi sẽ không dựa vào chúng cho các mục đích thương mại. –

+0

Phải, nhưng Fernando không chỉ định liệu ứng dụng có mang tính thương mại hay không! :) – elp

+0

Đúng, một liên kết tốt để xem là http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ –

1

Tôi đã viết thư viện khách hàng cho API Google Speech. Hoạt động tốt nhất với iOS và cũng hỗ trợ khác hệ thống Unix-like:

Chỉnh sửa: cố gắng ở đây: https://github.com/H2CO3/libsprec

Các vấn đề liên quan