14

Tôi thường bị nhầm lẫn với ý nghĩa của thuật ngữ mô tả trong ngữ cảnh của các tính năng hình ảnh. Mô tả mô tả vùng lân cận địa phương của một điểm (ví dụ: vectơ nổi) hay là một bộ mô tả thuật toán đưa ra mô tả? Ngoài ra, những gì chính xác là sau đó đầu ra của một tính năng-extractor?Mô tả tính năng trong xử lý hình ảnh (thuật toán hoặc mô tả) là gì?

Tôi đã tự hỏi mình câu hỏi này trong một thời gian dài, và lời giải thích duy nhất tôi đưa ra là một bộ mô tả vừa là thuật toán vừa mô tả. Một máy dò tính năng được sử dụng để phát hiện các điểm đặc biệt. Tuy nhiên, một trình trích xuất tính năng dường như không có ý nghĩa gì cả.

Hãy giúp tôi làm rõ sự hiểu lầm này. Cám ơn!

+0

Có thể điều này có thể giúp http://stackoverflow.com/questions/6832933/difference-between-feature-detection-and-descriptor-extraction?rq=1 – user1538798

+1

Cảm ơn bạn đã trả lời nhanh, thật không may, điều này dẫn đến nhiều hơn sự nhầm lẫn. – Richard

Trả lời

39

Một tính năng là một thuật toán mà phải mất một hình ảnh và kết quả đầu ra địa điểm (ví dụ: điểm ảnh tọa độ) của khu vực quan trọng trong hình ảnh của bạn. Ví dụ về điều này là corner detector, xuất ra vị trí của các góc trong hình ảnh của bạn nhưng không cho bạn biết bất kỳ thông tin nào khác về các tính năng được phát hiện.

Một tính năng mô tả là một thuật toán mà phải mất một hình ảnh và kết quả đầu ra mô tả tính năng/tính năng vectơ. Tính năng mô tả mã hóa thông tin thú vị thành một loạt các con số và hoạt động như một loại "dấu vân tay" số có thể được sử dụng để phân biệt một tính năng với một đối tượng địa lý khác. Lý tưởng nhất là thông tin này sẽ là bất biến theo biến đổi hình ảnh, vì vậy chúng tôi có thể tìm lại tính năng này ngay cả khi hình ảnh được chuyển đổi theo một cách nào đó. Một ví dụ sẽ là SIFT, mã hóa thông tin về hình ảnh vùng lân cận của địa phương là số của vectơ tính năng. Các ví dụ khác mà bạn có thể đọc là HOGSURF.


EDIT: Khi nói đến tính năng , các "vị trí" cũng có thể bao gồm một số mô tả kích thước hay quy mô của tính năng này. Điều này là do những thứ giống như các góc khi "phóng to" có thể không giống như các góc khi "thu nhỏ" và do đó việc chỉ định thông tin tỷ lệ là quan trọng. Vì vậy, thay vì chỉ sử dụng một cặp (x,y) làm vị trí trong "không gian hình ảnh", bạn có thể có một vị trí số ba là (x,y,scale) làm vị trí trong "không gian quy mô".

+0

Cảm ơn bạn đã trả lời nhanh. Tôi nghĩ, ý nghĩa kép của bộ mô tả này thực sự khó hiểu và thường không được sử dụng chính xác. – Richard

+0

Ngắn gọn và chính xác. +1 – rayryeng

+0

Câu trả lời hay. – Raj

Các vấn đề liên quan