2013-01-02 33 views
6

Tôi muốn bắt đầu một dự án lớn và cần phải so sánh hai tệp âm thanh để nhận được% kết quả phù hợp.so sánh hai tệp âm thanh. sound match

Ví dụ:

  1. âm thanh A là âm thanh gốc.

  2. audo B được ghi lại từ micrô. (mọi thứ đều giống như âm thanh A, ngoại trừ giọng nói)

  3. Tôi muốn biết B gần bằng A bằng phần trăm. (100% = giống hệt)

Có ai biết cách làm điều này không?

Có lẽ nó có thể là có thể bằng cách so sánh phổ của file A với quang phổ của tập tin B ..

+1

Tất cả phụ thuộc vào ý bạn là gì khi "so sánh hai tệp âm thanh". 100% là dễ tưởng tượng nhưng làm thế nào về 0% ?. Như bạn có thể thấy, định nghĩa "so sánh các tệp âm thanh" không được xác định rõ nên giải pháp của bạn cũng sẽ không được xác định. Nếu so sánh được tính trên một quan điểm nhận thức của xem (âm thanh mà giống nhau trên cả hai tập tin âm thanh) hoặc nó nên được dựa trên sự khác biệt số học byte byte chỉ? –

+0

Bạn có thể viết một cuốn sách về xử lý và so sánh âm thanh, vì vậy hãy bỏ phiếu để đóng là 'quá rộng'. –

+0

Điều gì có nghĩa là so sánh với bạn? Bạn phải kiểm tra giọng hát và nhạc cụ. Có thể điều này giúp được không? http://stackoverflow.com/questions/3673042/algorithm-to-remove-vocal-from-sound-track – SomeJavaGuy

Trả lời

2

Tôi đã làm việc này trong dự án khóa học undergrad của tôi, nhưng với các tập tin hình ảnh. Điều bạn muốn xem xét là Cross-correlation. Trong đó bạn có thể đo lường sự tương đồng giữa hai tín hiệu. Ngoài ra bạn có thể muốn tiền xử lý các tập tin âm thanh tức là: bình thường hóa, áp dụng một số bộ lọc thông thấp để loại bỏ tiếng ồn.

Tôi sẽ đề xuất Xử lý tín hiệu kỹ thuật số của Oppenheim để hiểu sâu về xử lý tín hiệu.

Nhưng một lần nữa các kỹ thuật này khá mơ hồ, cho đến khi yopu biết loại tương tự bạn muốn tìm.

+0

Để theo dõi hình ảnh so sánh, có một công ty (LTU) có ứng dụng để so sánh hình ảnh dựa trên một vector và sau đó các vectơ được so sánh, điều này phản ánh sự khác biệt giữa 2 hình ảnh. Đây không phải là so sánh byte/byte, nó phù hợp với hình ảnh bị cắt và đảo ngược. Có lẽ kỹ thuật của họ có thể thích nghi với các tập tin âm thanh. Điều đó nói rằng, tôi nghi ngờ bạn có thể có được bàn tay của bạn trên bản ngã của họ. –

+0

@ Nick.T Nhưng, tôi nghĩ rằng phải có một số dự án nguồn mở để làm những việc này. –

+0

Tôi chỉ biết điều đó bởi vì một khách hàng nói với tôi "Tôi muốn LTU". Vì vậy, không có nghiên cứu về các dự án mã nguồn mở cho tôi. Tôi đồng ý rằng loại bản ngã này phải tồn tại trong một dự án mã nguồn mở. Có lẽ câu hỏi có thể được lặp lại và được yêu cầu trong ngăn xếp 'mathematica' ... –