Tôi cần tạo một ứng dụng Android có thể nhận ra một số tệp âm thanh do tôi tạo và thực hiện hành động được công nhận. Vì vậy, một cái gì đó tương tự như Shazam/Soundhound, nhưng với các tập tin âm thanh của riêng tôi. Có API hoặc SDK hay gì đó cho việc này không? Tôi đã đọc về Echoprint, nhưng tôi hiểu nó là dành cho Windows và iOS và nó có vẻ khá khó khăn đối với tôi. Liệu điều đó có hiệu quả? Hoặc có bất kỳ lựa chọn nào khác không?API nhận dạng âm thanh, SDK (Android)
PS: Để làm rõ, tôi không muốn nhận dạng giọng nói hoặc chuyển văn bản thành giọng nói. Các tệp âm thanh của tôi có thể có nhạc, âm thanh bị bóp méo, hiệu ứng, vv
Cái này là bạn? không muốn nhận dạng giọng nói ?? Vậy làm cách nào bạn có thể nhận ra tệp âm thanh ??? –
như tôi đã nói, tôi muốn nó nhận ra các tệp âm thanh như Shazam hoặc Soundhound, không phải lệnh thoại của ai đó – KKO
cũng được sử dụng trong ứng dụng Star Trek Into Darkness của Qualcomm, nhưng tính năng sdk chưa được phát hành cho công chúng – KKO