Tương quan pha và biến đổi log-polar được thực hiện trong miền tần số, cả hai thuật toán này đều bắt nguồn từ định lý Fourier rằng hai hình ảnh đã dịch sẽ hiển thị sự khác biệt pha tương tự trong miền tần số. Mối tương quan pha có thể chỉ đăng ký chuyển động dịch trong khi biến đổi log-polar hoạt động trong miền log-polar mà về cơ bản chuyển đổi các thay đổi xoay và quy mô thành dịch tuyến tính. Vì vậy, bằng cách sử dụng phù hợp với log-polar, bạn có thể đăng ký hai hình ảnh được chia tỷ lệ và dịch các bản sao của nhau. Cả hai thuật toán này đều không thể đăng ký biến đổi biến dạng. Để phân tích chi tiết về sự mơ hồ và phạm vi xoay và biến thể quy mô mà các thuật toán này có thể xác định, bạn có thể tham khảo bài báo này "http://ieeexplore.ieee.org/document/901003/".
So khớp mẫu về cơ bản là tìm thấy sự hiện diện của mẫu đã biết trong hình ảnh cơ sở bằng cách sử dụng các chỉ số tương tự khác nhau (Tổng khác biệt bình phương, tương quan chéo chuẩn, khoảng cách Hausdorff, v.v.). Vì vậy, các trận đấu có thể được áp dụng trên một trong hai thuộc tính không gian (cường độ hình ảnh, bản đồ cạnh, HOG) hoặc thuộc tính tần số (giai đoạn). Mối tương quan pha và tương quan log-cực có thể được thực hiện trên cùng một kích thước hình ảnh để phù hợp với mẫu dựa trên giai đoạn về cơ bản sẽ tương ứng với việc tìm kiếm cùng một bản vá trong không gian tìm kiếm với giá trị tương quan cao nhất.
SIFT, SURF v.v. Đây là một chủ đề rất rộng và nhiều bài báo có sẵn trực tuyến so sánh chức năng của họ.
Theo kinh nghiệm của tôi SIFT, SURF là trình phân loại mạnh mẽ hơn trong việc bản địa hóa đối tượng trong một khung đơn, nhưng nếu bạn định định vị đối tượng trong video nơi thời gian tính toán là yếu tố hạn chế thì đối sánh mẫu sẽ phân phối tốt hơn.
Nguồn
2016-10-09 07:08:33