Tôi đang làm việc trên một số phần mềm cho trẻ em và tìm cách thêm khả năng cho phần mềm phản hồi một số âm thanh không lời nói. Ví dụ, vỗ tay, sủa, huýt sáo, rắm tiếng ồn, v.v.Phần mềm nhận dạng tiếng ồn hoặc âm thanh không nói?
Trước đây tôi đã sử dụng Sphinx CMU và Windows Speech API, nhưng tôi có thể nói rằng không có hỗ trợ nào cho tiếng ồn, và trên thực tế, tôi tin rằng họ sẽ tích cực lọc chúng ra.
Nói chung tôi đang tìm kiếm "Làm thế nào để có được chức năng này", nhưng tôi nghi ngờ nó có thể giúp đỡ nếu tôi phá vỡ nó xuống thành ba câu hỏi mà dự đoán của tôi cho những gì để tìm kiếm tiếp theo:
- Có cách nào để sử dụng một trong những công cụ nhận dạng giọng nói chính để nhận ra âm thanh không lời bằng cách thay đổi mô hình âm thanh hoặc từ vựng phát âm?
- (hoặc) Đã có thư viện hiện có để thực hiện nhận dạng tiếng ồn không phải từ không?
- (hoặc) Tôi có một chút quen thuộc với Mô hình Markov ẩn và công nghệ nhận dạng giọng nói cơ bản từ đại học, nhưng không có ước tính tốt về việc tạo ra một trình nhận dạng âm thanh/âm thanh rất nhỏ từ đầu (giả sử < 20 tiếng ồn được công nhận). Nếu 1) và 2) thất bại, bất kỳ ước tính nào sẽ mất bao lâu để cuộn của riêng tôi?
Cảm ơn
[Câu trả lời của tôi] (http://stackoverflow.com/q/8285673/22364) cho câu hỏi [Nhận dạng thời gian thực của âm thanh không phải lời nói, âm nhạc từ luồng micrô liên tục] (http: // stackoverflow.com/q/8285673) có thể có liên quan. –