Lowe tính toán “độ lặp lại” của thuật toán SIFT của mình như thế nào?

Trong bài báo năm 2004, "Các đặc điểm hình ảnh riêng biệt từ các điểm số quy mô-bất biến", ông đã đưa ra nhiều con số "lặp lại" như một hàm của XXX, ví dụ, hình 3,4 và 6, nhưng ông không giải thích cách tính toán "độ lặp lại".Lowe tính toán “độ lặp lại” của thuật toán SIFT của mình như thế nào?

Ông thực sự đã đưa ra một giải thích đơn giản về "độ lặp lại" trong hình 3 của trang 8, là "phần trăm các điểm chính được phát hiện lặp lại ở cùng một vị trí và chia tỷ lệ trong hình ảnh được chuyển đổi".

Tuy nhiên, 1) làm thế nào chúng ta có thể biết thời tiết một điểm quan trọng được phát hiện trong hình ảnh được chuyển đổi, đơn giản bằng cách kiểm tra từng điểm một? Tôi không nghĩ rằng đó là thực tế, vì có hàng ngàn keypints.

2) Chúng ta có thể xem xét điểm gần nhất có thể được phát hiện lặp lại trong VỊ TRÍ CÙNG? 3 pixel, 6 pixel? Hoặc không phải bằng pixel?

Tôi không biết làm cách nào tôi có thể tải lên giấy "Các tính năng hình ảnh riêng biệt từ các điểm chính quy mô-bất biến". Đây là liên kết: http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf

Nguồn

2012-04-24 user1222309

Vui lòng tham khảo/liên kết. Đã thêm liên kết – RBarryYoung

. thx – user1222309

Nếu bạn nhận thấy trong đoạn đầu tiên ở trang 9, tác giả đi vào chi tiết hơn về khả năng nói rằng điểm chính được phát hiện trong cùng một vị trí. Đầu tiên, "cùng một tỷ lệ" được đưa ra như là trong một yếu tố của sqrt(2) của quy mô chính xác, mà phải được biết đến với các nhà điều hành hoặc tay dán nhãn trong tập hợp dữ liệu. Thứ hai, "cùng một vị trí" được định nghĩa là nằm trong σ pixel theo hướng x và y, trong đó "σ là thang điểm của điểm chính (được xác định từ phương trình (1) là độ lệch chuẩn của Gauss nhỏ nhất được sử dụng trong sự khác biệt- của hàm Gaussian) "

Đối với câu hỏi tổng quát hơn của bạn, câu trả lời là không may là người ta phải thực sự kiểm tra các điểm chính một cách đầy đủ. Bạn thu thập tất cả các cặp vị trí/quy mô mà máy dò của bạn kích hoạt trên hình ảnh được chuyển đổi và bạn so sánh chúng với các vị trí thực sự trong hình ảnh gốc. Bạn cần phải có các vị trí keypoint được ghi bằng tay, hoặc chạy một thuật toán đơn giản trước (như sử dụng trình phát điểm khóa KLT cơ bản và chỉ lưu trữ danh sách tọa độ của các điểm chính mà nó tìm thấy và giả vờ như thế này là "sự thật" ... sẽ bị một số độ chính xác theo cách này nhưng bạn sẽ có nhiều khả năng tự động hóa quá trình).

Hoạt động grunt quy mô lớn như thế này (viết mã để kiểm tra toàn bộ một số điểm chính) thường là những thứ được nuôi cho học sinh tốt nghiệp. Blerg.

Nguồn

2012-04-24 02:35:13 ely

"cùng một vị trí" được định nghĩa là nằm trong σ pixel theo hướng x và y, trong đó "σ là thang điểm của điểm then chốt (được xác định từ phương trình (1) là độ lệch chuẩn của Gauss nhỏ nhất được sử dụng trong sự khác biệt- của hàm Gaussian) ". Vì vậy, điểm quan trọng với quy mô lớn, giả sử, 3 σ, sẽ có cùng sự khoan dung với điểm chính với quy mô nhỏ, nói 1,5 σ? – user1222309

Đó là trích dẫn trực tiếp từ bài báo, vì vậy phương trình (1) đề cập đến bài báo ... – ely

Tôi hiểu phương trình (1), điều tôi không hiểu là dung sai "σ pixel" dành cho tất cả các điểm chính, có nghĩa là điểm then chốt có quy mô lớn (3σ), sẽ có cùng sự khoan dung với điểm chính với quy mô nhỏ (1.5σ), điều đó không công bằng, tôi nghĩ vậy. Bạn có thể cho tôi một gợi ý không? – user1222309

Lowe tính toán “độ lặp lại” của thuật toán SIFT của mình như thế nào?

Trả lời

Các vấn đề liên quan