2013-06-18 44 views
7

HOG phổ biến trong phát hiện của con người. Nó có thể được sử dụng để phát hiện các đối tượng như cốc trong hình ảnh chẳng hạn.Biểu đồ định hướng đối tượng Gradients phát hiện

Tôi rất tiếc vì không hỏi câu hỏi lập trình, nhưng tôi muốn có ý tưởng nếu tôi có thể sử dụng hog để trích xuất đối tượng địa lý.

Theo nghiên cứu của tôi, tôi không có vài ngày tôi cảm thấy có nhưng tôi không chắc chắn.

+0

Điều này có thể giúp bạn: http://www.geocities.ws/talh_davidc/ – SomethingSomething

Trả lời

29

Có, HOG (Histogram of Oriented Gradients) có thể được sử dụng để phát hiện bất kỳ loại đối tượng nào, đối với máy tính, hình ảnh là một loạt pixel và bạn có thể trích xuất các đối tượng bất kể nội dung của chúng. Tuy nhiên, một câu hỏi khác là hiệu quả của nó khi làm như vậy.

HOG, SIFT và các trình trích xuất tính năng khác là các phương pháp được sử dụng để trích xuất thông tin có liên quan từ một hình ảnh để mô tả nó theo cách có ý nghĩa hơn. Khi bạn muốn phát hiện một đối tượng hoặc một người trong một hình ảnh có hàng nghìn (và có thể là hàng triệu) pixel, sẽ không hiệu quả khi chỉ cần nạp một vectơ với hàng triệu số vào thuật toán học máy như

  1. Sẽ mất một số lượng lớn thời gian để hoàn
  2. sẽ có rất nhiều thông tin ồn ào (nền, làm mờ, sét và thay đổi luân phiên) mà chúng tôi không muốn coi là quan trọng

thuật toán HOG, cụ thể, tạo biểu đồ định hướng cạnh từ các bản vá lỗi nhất định trong hình ảnh. Một miếng vá có thể đến từ một vật thể, một người, nền vô nghĩa, hoặc bất cứ thứ gì khác, và chỉ đơn thuần là một cách để mô tả một khu vực sử dụng thông tin cạnh. Như đã đề cập trước đó, thông tin này sau đó có thể được sử dụng để nạp thuật toán học máy như máy vectơ hỗ trợ cổ điển để huấn luyện một trình phân loại có thể phân biệt một loại đối tượng này với đối tượng khác.

Lý do khiến HOG có nhiều thành công với phát hiện người đi bộ là vì một người có thể thay đổi màu sắc, quần áo và các yếu tố khác, nhưng các cạnh chung của người đi bộ vẫn tương đối ổn định, đặc biệt là xung quanh khu vực chân. Điều này không có nghĩa là nó không thể được sử dụng để phát hiện các loại đối tượng khác, nhưng thành công của nó có thể khác nhau tùy thuộc vào ứng dụng cụ thể của bạn. The HOG paper hiển thị chi tiết cách các mô tả này có thể được sử dụng để phân loại.

Điều đáng lưu ý là đối với một số ứng dụng, kết quả thu được bằng HOG có thể được cải thiện đáng kể bằng cách sử dụng lược đồ hình chóp. Điều này hoạt động như sau: Thay vì trích xuất một vector HOG đơn lẻ từ một hình ảnh, bạn có thể chia hình ảnh (hoặc bản vá) thành một số hình ảnh phụ, trích xuất từ ​​mỗi bộ phận nhỏ hơn này thành một vector HOG riêng lẻ. Quá trình này có thể được lặp lại. Cuối cùng, bạn có thể có được một bộ mô tả cuối cùng bằng cách ghép tất cả các vectơ HOG vào một vectơ đơn, như trong hình dưới đây.

Pyramidal HOG

này có ưu điểm là ở quy mô lớn hơn các tính năng HOG cung cấp thông tin toàn cầu hơn, trong khi ở quy mô nhỏ hơn (có nghĩa là, trong phân khu nhỏ hơn) mà họ cung cấp chi tiết hơn hạt mịn. Điểm bất lợi là vector mô tả cuối cùng phát triển lớn hơn, do đó mất nhiều thời gian hơn để trích xuất và đào tạo bằng cách sử dụng một trình phân loại đã cho.

Trong ngắn: Có, bạn có thể sử dụng chúng.

Các vấn đề liên quan