20

Tôi đang phát triển một trang web, và tôi muốn giúp đỡ người khiếm thị sử dụng nó bằng giọng nói, vì vậy tôi sẽ sử dụng:Javascript Speech-to-Text cho người mù

  • Text-to-speech , để cung cấp cho một số posibilities cho người dùng
  • Speech-to-text, cho phép người dùng sử dụng giọng nói của mình để chọn một

tôi đã có một số hoạt Javascript thư viện text-to-speech (như speak.js), nhưng bây giờ tôi cần một bài phát biểu tốt. Có một số giải pháp cho mục đích này (như speechapi), nhưng chúng sử dụng Java Applet hoặc Flash và tôi chỉ muốn phụ thuộc vào JavaScript, để tránh các plugin.

Tôi đang thử tính năng nhập bằng giọng nói của HTML5 với x-webkit-speech và Google Chrome và nó tốt, nhưng bạn cần phải nhấp vào biểu tượng (và người mù không thể sử dụng chuột tốt). Có thể sử dụng x-webkit-speech khi nhấn phím không? Bạn có biết bất kỳ API thay thế (JavaScript) nào không?

Cảm ơn bạn!

+0

+1 câu hỏi xuất sắc – Blaster

+3

Điều hướng bằng giọng nói không nên là một phần của trình duyệt, thay vì trang web? – Bergi

+1

@Bergi Điều hướng có thể là khả năng đáp ứng của trình duyệt, nhưng trang web của tôi phức tạp hơn. Nó có các trò chơi đơn giản để cải thiện khả năng não của bạn, và ý định của tôi là điều chỉnh một số người trong số họ cho người mù, vì vậy trình duyệt không thể quản lý các trò chơi HTML5 của tôi. – sgmonda

Trả lời

2

Google Dịch là văn bản rất tốt cho công cụ phát biểu. Tôi đã từng đọc một văn bản với nó. Ví dụ bạn có một văn bản: welcome to Stack overflow bạn có thể gọi như thế này

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input 

sau đó sử dụng âm thanh trình duyệt để chơi nó

Đối với đầu vào bài phát biểu của bạn có thể thủ công kích hoạt quá trình lắng nghe, xem tại đây http://code.google.com/chrome/extensions/experimental.speechInput.html

+0

Nhưng sau đó, người dùng sẽ cần cài đặt tiện ích mở rộng cho Chrome. Đó là một khả năng, nhưng tôi không muốn phụ thuộc vào một phần mở rộng. Lý tưởng nhất, người dùng chỉ cần mở trình duyệt của mình (giờ đây, Chrome là trình duyệt duy nhất hỗ trợ nhập liệu giọng nói, nhưng đây là thông số kỹ thuật HTML5, vì vậy tất cả trình duyệt sẽ hỗ trợ nó theo thời gian) – sgmonda

3

Có thể sử dụng x-webkit-speech khi nhấn phím không?

Theo số post và điều này post bạn không thể ghi đè bắt đầu lời nói bằng cách nhấp vào micrô.

Điều x-webkit-speech đang thực hiện là sử dụng khả năng thu âm của HTML5 và gửi âm thanh đến máy chủ của Google để xử lý, trả về kết quả bằng JSON. Đây là blogger has reversed engineered it. Bạn có thể phát triển một thư viện JavaScript tìm kiếm một phím bấm để bắt đầu ghi lại âm thanh trên các trình duyệt được kích hoạt HTML5 và gửi nó tới dịch vụ của Google hoặc tới một dịch vụ mà bạn đã tạo. Nhược điểm của việc sử dụng dịch vụ của Google là nó là một API không được hỗ trợ và có thể thay đổi bất cứ lúc nào. Nhược điểm để phát triển dịch vụ của riêng bạn là nó có thể tốn kém để phát triển và duy trì.

Bạn có biết bất kỳ API thay thế (JavaScript) nào không?

Điều này post và điều này post liệt kê một số dịch vụ có sẵn để nhận dạng giọng nói. Tôi không thấy Nuance được liệt kê. Bạn có thể sử dụng Dragon Mobile SDK cho việc này. Và bạn có thể muốn kiểm tra vào ISpeech.

Các vấn đề liên quan