Thuật toán băm thông thường hoặc thuật toán CRC không hoạt động tốt với dữ liệu hình ảnh. Bản chất chiều của thông tin phải được tính đến.
Nếu bạn cần dấu vân tay cực kỳ mạnh mẽ, các phép biến đổi affine (chia tỷ lệ, xoay, dịch, lật) được tính, bạn có thể sử dụng Radon transformation on the image source để tạo bản đồ quy chuẩn của dữ liệu ảnh - lưu trữ ảnh này với từng ảnh chỉ so sánh dấu vân tay. Đây là một thuật toán phức tạp và không dành cho những người yếu tim.
một số giải pháp đơn giản có thể xảy ra:
- Tạo một biểu đồ độ sáng cho hình ảnh như một dấu vân tay
- Tạo thu nhỏ lại các phiên bản của mỗi hình ảnh như một dấu vân tay
- Kết hợp kỹ thuật (1) và (2) vào cách tiếp cận lai để cải thiện chất lượng so sánh
Biểu đồ độ sáng (đặc biệt là biểu đồ được tách thành các thành phần RGB) là một dấu vân tay hợp lý r một hình ảnh - và có thể được thực hiện khá hiệu quả. Trừ một biểu đồ từ một biểu đồ khác sẽ tạo ra một lược đồ mới mà bạn có thể xử lý để quyết định hai hình ảnh tương tự như thế nào. Biểu đồ, bởi vì chỉ đánh giá sự phân bố và sự xuất hiện của độ sáng/thông tin màu xử lý biến đổi affine khá tốt. Nếu bạn lượng hóa thông tin độ sáng của mỗi thành phần màu xuống giá trị 8 bit, dung lượng lưu trữ 768 byte là đủ cho dấu vân tay của một hình ảnh có kích thước gần như hợp lý. Biểu đồ độ sáng tạo ra âm bản sai khi thông tin màu trong hình ảnh được điều khiển. Nếu bạn áp dụng các biến đổi như độ tương phản/độ sáng, áp phích, thay đổi màu sắc, thay đổi thông tin độ sáng. Sai tích cực cũng có thể xảy ra với một số loại hình ảnh nhất định ... chẳng hạn như phong cảnh và hình ảnh trong đó một màu duy nhất thống trị người khác.
Sử dụng hình ảnh được chia tỷ lệ là một cách khác để giảm mật độ thông tin của hình ảnh xuống mức dễ so sánh hơn. Giảm dưới 10% kích thước hình ảnh ban đầu thường mất quá nhiều thông tin sẽ được sử dụng - vì vậy, hình ảnh 800x800 pixel có thể được thu nhỏ xuống 80x80 và vẫn cung cấp đủ thông tin để thực hiện lấy dấu vân tay. Không giống như dữ liệu biểu đồ, bạn phải thực hiện chia tỷ lệ dị hướng của dữ liệu hình ảnh khi độ phân giải nguồn có các tỷ lệ khung hình khác nhau. Nói cách khác, giảm một hình ảnh 300x800 thành hình thu nhỏ 80x80 gây biến dạng của hình ảnh, chẳng hạn khi so sánh với hình ảnh 300x500 (rất giống) sẽ gây ra âm bản sai. Dấu vân tay hình thu nhỏ cũng thường tạo ra âm bản sai khi các biến đổi affine được tham gia. Nếu bạn lật hoặc xoay hình ảnh, hình thu nhỏ của nó sẽ khác với hình ảnh gốc và có thể dẫn đến kết quả dương tính giả.
Kết hợp cả hai kỹ thuật là một cách hợp lý để phòng ngừa cược của bạn và giảm sự xuất hiện của cả hai xác thực sai và âm tính giả.
Ngôn ngữ thư viện phải dành cho? –