Làm cách nào để thực hiện văn bản thành lời nói (TTS)? Có API mở, miễn phí cho tổng hợp TTS không? Tôi biết về Google Dịch, nhưng giấy phép không rõ ràng với tôi (một vấn đề khác là họ chặn một yêu cầu nếu nó có chứa một liên kết giới thiệu). Bất kỳ ý tưởng?Văn bản để phát biểu trên Quizlet.com
Trả lời
Majdron,
Tôi là nhà phát triển chính tại Quizlet. Chúng tôi đang sử dụng một sự kết hợp của công nghệ riêng của chúng tôi và cấp phép/mua phần mềm TTS từ một số công ty khác nhau.
Có một số mã nguồn mở TTS động cơ/tiếng nói:
- http://www.cstr.ed.ac.uk/projects/festival/
- http://www.babelfish.org/tts-free.htm
- http://espeak.sourceforge.net/
- http://freetts.sourceforge.net/docs/index.php
- http://mary.dfki.de/
Chúc may mắn!
Google vừa giới thiệu quyền truy cập dựa trên trình duyệt vào công cụ giọng nói của mình thông qua HTML5.
http://slides.html5rocks.com/#speech-input
Để có được trang này để làm việc, tôi ra mắt trình duyệt Chromium như sau trong Ubuntu:
$ chromium-browser --enable-speech-input
Tôi không chắc chắn nếu điều này làm việc trong hệ điều hành khác.
Một dự án thú vị là Wami từ MIT:
Những tiếng nói âm thanh chính xác giống như http://www.neospeech.com. Ngoài ra, danh sách các ngôn ngữ của họ khớp chính xác.
Nó không miễn phí, bạn phải cấp phép.
Tôi không biết Quizlet cụ thể nào đang sử dụng, nhưng giả sử họ đang sử dụng dịch vụ miễn phí thì có thể là TTS-API (http://tts-api.com/) gần đây đã được giới thiệu trên Hacker News.
Từ những gì tôi biết là "TTS web-API" miễn phí sử dụng duy nhất trên mạng. Vui lòng nhận xét bên dưới nếu tôi sai - Tôi rất muốn tìm các dịch vụ miễn phí tương tự. Có rất nhiều dịch vụ chỉ trả tiền ở đó nhưng rất ít dịch vụ thực sự miễn phí.
Vì tìm hiểu về TTS-API trên HN, tôi đã sử dụng thành công nó trong một dự án ứng dụng gần đây. Vì TTS chỉ là một tìm nạp HTTP nên tôi đã có thể tích hợp nhanh chóng nó trong cả phiên bản ứng dụng của tôi và iOS. Dịch vụ này dường như rất nhanh, vì vậy không có khiếu nại cho đến thời điểm này :-)
Không ai trả lời đúng. Họ có động cơ TTS riêng của họ được kết nối với một tập tin duy nhất tại http://quizlet.com/tts/en.mp3 tập tin có đối số với nó để url http://quizlet.com/tts/en.mp3?v=14&b=QXJlYSBvZiBwYXJhbGxlbG9ncmFt&s=m5dx52Q. nói "Diện tích hình bình hành" nhờ chuỗi base64 đầu tiên có nhãn b. Tôi đã không phát hiện ra những gì v hoặc s được sử dụng cho nhưng tôi biết họ là điều cần thiết để làm cho các tập tin nói. Tôi sẽ nghiên cứu thêm và quay lại câu trả lời này.
jj b là chính xác. Động cơ cốt lõi của các tính năng phát biểu của Quizlet là Neospeech, và sử dụng VTML (VoiceText [TM] Markup Language) chính xác của Neospeech, theo như tôi có thể nói.
Điều này sẽ phù hợp hơn khi nhận xét về câu trả lời hiện có của jj b (hoặc vì bạn chưa thể nhận xét về các câu trả lời không phải của bạn, một * upvote * đơn giản sẽ thích hợp). – JonK
- 1. Swing JButton: Biểu tượng phía trên Văn bản
- 2. Tạo hiệu ứng văn bản phát sáng trên iOS
- 3. Biểu tượng Qt QPushbutton phía trên Văn bản
- 4. Xóa Firefox phát sáng trên vùng văn bản tiêu điểm
- 5. Thuật toán để phát hiện sự hiện diện của văn bản trên hình ảnh
- 6. Làm cách nào để vẽ văn bản trên canvas?
- 7. Bàn điều khiển văn bản để phát triển trong JAWS?
- 8. Nếu Biểu mẫu tối, thì Văn bản trên biểu mẫu phải là Ánh sáng
- 9. jquery tự động phát triển vùng văn bản so với văn bản ban đầu
- 10. Tôi làm cách nào để bao gồm một siêu văn bản vào các văn bản trên một ô trên R?
- 11. Biểu tượng VÀ Văn bản trong UISegmentedController
- 12. Làm thế nào để dừng việc hủy sự kiện hộp văn bản trên biểu mẫu đóng
- 13. Số phiên bản trong văn bản biểu mẫu Winform
- 14. Thêm văn bản trên HTML5 Video
- 15. Làm thế nào để vẽ văn bản trên picturebox?
- 16. Trò chuyện văn bản dựa trên web?
- 17. Cột "văn bản" trên all_views
- 18. Thả bóng trên văn bản
- 19. ViewPagerIndicator Tabs: Các biểu tượng trên bản
- 20. Thêm văn bản động trên hình ảnh
- 21. Làm cách nào để tìm văn bản có văn bản được kéo dài trên vim?
- 22. Làm cách nào để che phủ văn bản trên văn bản khác bằng CSS?
- 23. Văn bản trên một ProgressBar trong WPF
- 24. Phát hiện khi người dùng chọn văn bản trong vùng văn bản
- 25. Văn bản mặc định của JQuery trên hộp văn bản trống
- 26. Phát hiện một số văn bản đã được chọn trong một hộp văn bản
- 27. Thuật toán hoặc thư viện để phân tích văn bản, cụ thể: từ, cụm từ trên văn bản và tập hợp văn bản
- 28. Làm cách nào để đặt nhiều nhịp trên văn bản của TextView trên cùng một phần văn bản?
- 29. Thêm dấu đầu dòng văn bản vào biểu mẫu C#
- 30. C# Nhận văn bản tắt notificationIcons (biểu tượng khay)
Đây là phần nhận dạng giọng nói chứ không phải bên TTS mà OP hỏi. Quizlet cũng đang sử dụng WAMI của MIT. – philfreo