2012-03-20 22 views
20

Tôi đang phát triển một ứng dụng iOS với SDK cho iOS 5.0 và XCode 4.2.Cách hoạt động của Shazam hoặc Sound Hound?

Tôi muốn phát triển ứng dụng nhận dạng âm thanh. Tôi thấy có một ứng dụng được gọi là Sound Hound nhận ra âm nhạc và nói với nghệ sĩ và tiêu đề.

Tôi có thể làm điều gì đó tương tự? Tôi muốn so sánh âm thanh với cơ sở dữ liệu âm thanh hiện có. Tôi có thể làm như thế nào?

Có thể tôi có thể sử dụng Chuyển đổi Fourier. Tôi không biết cách xử lý âm thanh. Hoặc nó có thể tương tự như nhận dạng giọng nói, phải không?

+6

Đó là một thuật toán khá đơn giản, tuy nhiên chìa khóa thực sự của ứng dụng là thực tế thuật toán được cấp bằng sáng chế, vì vậy nếu bạn cố tự mình thực hiện, luật sư có răng ma cà rồng sẽ xuất hiện từ không khí mỏng và hút cuộc sống của bạn ...;) – Lindydancer

+0

Vâng, tôi không muốn điều đó. Tôi muốn biết làm thế nào tôi có thể so sánh âm thanh. Sử dụng Fourier Transform? – VansFannel

+1

Điều này có thể giúp: http://gizmodo.com/5647458/how-shazam-works-to-identify-nearly-every-song-you-throw-at-it – VansFannel

Trả lời

21

Tôi đã xem một bài báo giải thích cách các thuật toán tìm kiếm âm thanh hoạt động. Đây là link. Nó được viết bởi một trong những nhà phát triển của Shazam, một ứng dụng đối thủ của SoundHound.

1

Shazam Ứng dụng là một trong những ví dụ tốt nhất cho ứng dụng trong dữ liệu mở liên kết phải mất nhạc mẫu ngắn từ người dùng cuối và xác định bài hát từ bộ dữ liệu cũng như liên kết để mua album.

Người dùng gắn thẻ bài hát trong 10 giây và ứng dụng tạo vân tay âm thanh dựa trên một số neo của giản đồ quang phổ và vùng mục tiêu giữa chúng.

Đối với mỗi điểm của khu vực mục tiêu, chúng tạo ra giá trị băm là sự kết hợp tần suất mà điểm neo được đặt, tần suất tại điểm trong vùng đích và chênh lệch thời gian giữa điểm trong vùng đích và khi điểm neo nằm trong bài hát.

Khi dấu vân tay của âm thanh được tạo, Shazam bắt đầu tìm kiếm các kết quả phù hợp trong cơ sở dữ liệu. Nếu có sự trùng khớp, thông tin sẽ được trả lại cho người dùng; nếu không nó sẽ trả về một cuộc đối thoại "bài hát không được biết đến".

Các vấn đề liên quan