22

Tôi muốn thử tạo trình chiếu jQuery bằng các lệnh thoại đơn giản như "tiếp theo" hoặc "trước đó". Có cách nào để sử dụng nhận dạng giọng nói của Google không? Tôi biết về x-webkit-speech của Chrome, nhưng tôi phải bấm vào một nút để sử dụng nó.Có API cho công nghệ nhận dạng giọng nói của Google không?

Tôi đã thử WAMI của MIT, nhưng tôi thấy nó chậm hơn và kém chính xác hơn nhận thức giọng nói của Google.

+0

bản sao có thể có của [Cách hoạt động của Tìm kiếm bằng giọng nói của Google? Có API cho điều đó không?] (Http://stackoverflow.com/questions/6389039/how-google-voice-search-works-is-there-an-api-for-that) –

Trả lời

20

Tính đến hôm nay này ngay bây giờ tồn tại, cho Chrome: http://chrome.blogspot.co.uk/2013/01/hello-browser.html

(api doc)

+10

Tôi đã tạo một thư viện JavaScript kết thúc tốt đẹp điều này và làm cho việc thêm lệnh thoại vào trang web hoặc ứng dụng của bạn trở nên cực kỳ dễ dàng. Kiểm tra nó tại https://www.talater.com/annyang/ –

1

Tôi thấy điều này, tôi đã không đích thân sử dụng nó để tôi không biết nếu nó là hoàn toàn những gì bạn đang tìm kiếm nhưng hãy xem.

http://captico.com/introducing-speech-2-text-api-by-google/2011/03

+0

Giao diện đẹp bằng cách sử dụng tính năng này công nghệ là https://www.textfromtospeech.com/uk/voice-to-text/ –

2

Vấn đề là những gì sẽ chụp ngôn luận của người dùng của bạn và gửi một số máy chủ ngôn luận để xử lý. x-webkit-speech được tích hợp vào trình duyệt và trình duyệt sử dụng card âm thanh của PC để ghi lại lời nói. Javascript/Jquery trong một trình duyệt không thể truy cập vào các thiết bị phần cứng. Tôi không biết liệu Chrome có hiển thị bất kỳ đối tượng x-webkit-speech nào trong DOM để bạn có thể chụp qua Javascript hay không.

Điều đó nói rằng, mọi người đã thiết kế ngược api lời nói của Google và sử dụng nó từ mã. Xem http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ để biết ví dụ.

+0

Tôi không thể sử dụng nó trong năm 2015. Có ai có nó hoạt động không? – user3526

12

Đối với một cách dễ dàng để làm điều này với JavaScript, hãy kiểm tra annyang, mà là một thư viện mà làm cho đối phó với nhận dạng giọng nói siêu dễ dàng.

Các vấn đề liên quan