Có ai có kinh nghiệm với bất kỳ API nhận dạng giọng nói nguồn mở hoặc tương đối rẻ nào cho java không? Tôi đang tìm kiếm một cái gì đó mà sẽ biến lời nói thành văn bản.Nhận dạng giọng nói Java
Từ trang nhận dạng giọng nói java trên mặt trời, có vẻ như nó là cái gì đó là khá chết. Yêu cầu của tôi là cái gì đó ít nhất chạy trên Linux.
Có ai có thể đề xuất điều gì đó không? Pure java sẽ là một phần thưởng, một giải pháp dựa trên Linux khác có thể được xem xét. Và vì đây là một dự án nhà ... rẻ hơn thì càng tốt.
- Sửa
CMU Sphinx Như Amit chỉ ra CMU Sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php Vấn đề của tôi là một tỷ lệ lỗi từ khổng lồ. Đào tạo có vẻ như một dự án tất cả trong chính nó, tôi hy vọng sẽ thu thập một số sức mạnh để thử nó cuối tuần này.
IBM ViaVoice
Có thông báo tin tức nổi xung quanh năm 2004 về Via Voice being made open source. Có vẻ như việc phát hành tin tức là quá sớm và nó chưa bao giờ xảy ra. VIA Voice là released for linux tại một số điểm, nhưng Dường như họ dừng lại. Tất cả những gì dường như còn lại trên trang web của IBM là ViaVoice embedded.
IBM Websphere Voice
Tôi tưởng tượng đây là lý do tại sao ViaVoice (máy tính để bàn) có vẻ như bị ngưng. IBM đã tạo ra giải pháp thương mại này, chi phí sẽ cao hơn một cánh tay và một chân. Và chỉ cần sử dụng nó sẽ đưa những người bạn đã để lại, ít nhất là sau khi kinh nghiệm của tôi với websphere và IDE của họ.
Nuance
Dường như họ vẫn có thể tạo sản phẩm cho Linux. Nhưng tôi nghĩ rằng họ đã mất và theo IBM vào thị trường máy chủ. Tôi không chắc chắn về điều này, trang web của họ không thân thiện trong việc tìm kiếm thông tin hữu ích.
Open Mind/Free Speech
Những người này tiếp tục thay đổi tên dự án của họ. Có lẽ một số công ty đói tiền cứ đe dọa họ, nhưng tôi không biết. Dự án trông hơi chết.
Tôi có thể thử đào tạo Nhân sư cuối tuần này để xem liệu bạn có muốn trở thành bạn bè hay không. Trường hợp khác tệ hơn, tôi sẽ xem xét sử dụng giải pháp lời nói của Microsoft. Nó đã làm việc tốt cho tôi trong quá khứ, nhưng nó không phải là một giải pháp Linux tuyệt vời. Tôi có thể sử dụng nó qua rượu, nhưng sau đó tôi sẽ có hai máy chủ riêng biệt ... lộn xộn lộn xộn.
Ồ và những gì có vẻ là một nơi tốt để truy cập cho giọng nói/lời nói SpeechTechMag. Họ có một "Tham khảo Anual" có một danh sách các công ty mà bằng cách nào đó liên quan đến giọng nói/lời nói.
Sau khi làm việc với nó, nó thực sự khá khủng khiếp. Không nhận ra bất cứ điều gì, và nó không giống như tôi có một giọng nói kinh khủng hay bất cứ điều gì. Đào tạo có vẻ như thậm chí còn nhiều vấn đề hơn và trừ khi bạn sẵn sàng bỏ túi cho một số cơ sở dữ liệu bên thứ ba mà bạn đang ngồi với đáy của đống. – guyumu
Tôi chưa từng có kinh nghiệm thực tế nào với nó./ –
Câu hỏi này khá cũ nhưng tôi muốn nói với hiệu suất hiện tại của Nhân sư. Tôi đã sử dụng Sphinx 4 và mô hình WSJ thích nghi và nó đã cho tôi độ chính xác 86%. – Shekhar