2016-12-07 66 views
8

Tôi biết câu hỏi này đã được hỏi nhiều lần trước đây nhưng tôi không tìm thấy nhiều trên google ngoại trừ một vài gói được viết bởi một số tác giả. Trong mọi trường hợp, có bất kỳ kế hoạch bao gồm các lớp gộp chung (chính thức) trong tensorflow vì nó là một thành phần quan trọng để phát hiện đối tượng và các nhiệm vụ khác và không có quyền truy cập vào nó là một cơn đau trong khi sử dụng tensorflow.Có kế hoạch nào cho lớp ROI Pooling trong chuỗi lưu lượng để phát hiện đối tượng không?

Bất kỳ nhận xét hoặc triển khai thay thế nào (nếu được xác minh) đều được hoan nghênh.

+2

Đây là thành phần quan trọng đối với nhanh (er) r-cnn, không phải để phát hiện đối tượng. Có những phương pháp khác không sử dụng nó - hãy xem https://arxiv.org/abs/1611.10012 – etarion

+0

Cảm ơn bạn đã đề cập đến bài viết này và tôi sẽ xem xét nó. Có Tôi biết gần đây YOLO và máy dò SSD đã được đề xuất có thể phát hiện mà không yêu cầu khu vực rõ ràng. Tuy nhiên, việc gộp nhóm ROI cũng có thể được xem như là một mô-đun chuẩn để nhóm các đối tượng địa lý trong một lớp đối tượng dựa trên vị trí của nó trong không gian hình ảnh thực tế. Điều này đã sử dụng ngoài phát hiện đối tượng, ví dụ: công việc gần đây về tham chiếu trực quan. – ksikka

+0

Một lần nữa, cảm ơn bạn đã gửi bài viết này @etarion như tôi thấy rằng tổng hợp roi đã được thực hiện bằng cách sử dụng quy trình thay đổi kích thước cắt trên bản đồ tính năng. Tôi có thể thấy rằng đó là một cách khác để giải quyết vấn đề này. – ksikka

Trả lời

8

Tôi đã có thể tìm thấy câu trả lời cho câu hỏi của mình với bài báo ở trên. Bạn có thể sử dụng chức năng tf.image.crop_and_resize để cắt bất kỳ phần nào của mạng và thay đổi kích thước của nó. Tương tự như gộp nhóm ROI, bạn có thể cắt một hộp giới hạn (chia tỷ lệ xuống theo số bước downsampling ví dụ 32 trong VGG16) và đổi kích thước nó thành NxN (ví dụ 7x7 trong VGG16), sau đó có thể được đưa vào lớp Hoàn toàn được Kết nối.

Các vấn đề liên quan