2009-03-16 50 views
23

Tôi không chắc liệu Youtube có phải là trang web duy nhất có công nghệ này hay không, nhưng nhận dạng nội dung trong YT (Content ID) về cơ bản là công nghệ tự động xác định và xóa vi phạm bản quyền. Bạn có thể đọc thêm về nó ở đây:Công nghệ nhận dạng nội dung Youtube?

http://www.youtube.com/t/contentid

Vâng khi một trong những video của tôi (có chứa một bài hát cụ thể) đã được gắn thẻ và xóa do vi phạm bản quyền, tôi nghĩ nó [sytstem nội dung ID] là có lẽ là câm. Vì vậy, tôi đã làm một số thí nghiệm: không ai trong số đó bị lừa lọc ~

  • gia tăng một loạt các tiếng bíp ở giữa của bài hát
  • Thay đổi sân nhiều lần qua bài hát
  • Thay đổi khối lượng một vài lần
  • điều chỉnh tốc độ
  • Added lớp phủ âm thanh
  • gia tăng một vài hiệu ứng âm thanh

Mặt khác, tôi không biết bất kỳ tài liệu nào được kết hợp sai với bản quyền. Ví dụ, một phiên bản piano của một bài hát sẽ không kích hoạt sai kiểm duyệt.

Tôi không ranting về video của mình bị xóa. Tôi chỉ ngạc nhiên về hiệu quả kiểm duyệt nội dung. Tôi tự hỏi làm thế nào các thuật toán xác định chính xác bài hát là bản quyền vi phạm ngay cả sau khi tất cả các nỗ lực của tôi để phá vỡ nó. Bất kỳ nỗ lực nào để so khớp trực tiếp đều sẽ bị đánh bại một cách im lặng, bất kỳ thuật toán nào liên quan đến các mẫu ghi chú có thể sẽ bị lừa bởi tiếng bíp và chuyển dịch sân.

Vâng đây là chi tiết của sự tò mò của tôi hơn là một câu hỏi cấp bách ..

+0

Tôi cũng tìm thấy một cái gì đó tương tự trong imeem.com, họ có thể xác định "trùng lặp" của một bài hát ngay cả khi tên, thẻ, v.v ... đều khác nhau! – hasen

+0

Hmm, hầu như không có liên quan bởi vì sau đó bất kỳ kết hợp hoặc băm của hai bài hát sẽ trở lại đúng sự thật. Giả sử rằng các bài hát giống hệt nhau. – Bai

+0

Chúng sử dụng một dạng [ghi vân tay âm thanh] (https://en.wikipedia.org/wiki/Acoustic_fingerprint). Mặc dù Google đã xuất bản các bài viết về chủ đề này, tôi tin rằng thuật toán mà họ sử dụng không công khai (có thể khiến mọi người khó tìm cách xung quanh nó hơn). – Zaz

Trả lời

14

Pedro Moreno và những người khác tại Google/Youtube làm việc trên đó. Họ sử dụng finite-state transducers để nhận biết các chuỗi đơn vị điện thoại nghe nhạc, tương tự như âm vị trong nhận dạng giọng nói tự động.

Kiểm tra bài viết này:

Nếu bạn thay đổi tốc độ hoặc sân trong suốt toàn bộ bài hát Tôi ngạc nhiên rằng các thuật toán vẫn nhận bài hát. Nhưng có lẽ họ bình thường hóa các sân và tốc độ (sử dụng thời gian giữa các nhịp) để có thể nhận ra các phiên bản được bảo hiểm là tốt, không chỉ là những bản gốc. Nhưng nó không đáng ngạc nhiên rằng nó có thể bỏ qua các tiếng bíp bạn thêm vào, vì có đủ sự tương đồng trong dòng âm thanh của bạn nếu không.

(Thực ra, thuật toán dựa trên trạng thái hữu hạn sẽ tuyệt vời để áp dụng cho thư viện iTunes của tôi, để gắn thẻ các tệp một cách chính xác. Vì các dịch vụ như MusicBrainz dựa vào nhiều kết quả băm chính xác của âm thanh và mục nhập cơ sở dữ liệu. phương pháp đầu dò dường như có khả năng chịu được sự khác biệt trong việc nhận ra các tập tin.)

+0

vì vậy tôi vẫn tự hỏi làm thế nào những người khác có thể tải lên một phần các đoạn phim và không bị chặn? –

Các vấn đề liên quan