Đặt các hộp giới hạn xung quanh các đối tượng thường được gọi là phát hiện trong lô tô của trường và có toàn bộ danh mục mạng được thiết kế cho nó. Có một danh mục riêng biệt trong số PASCAL VOC competition để phát hiện và đó là một nơi tốt để tìm các mạng phát hiện tốt
Mạng phát hiện yêu thích của tôi (bộ dẫn hiện tại cho tập dữ liệu PASCAL 2012) là YOLO, bắt đầu bằng trình phân loại điển hình , nhưng sau đó có một số lớp bổ sung để hỗ trợ các hộp giới hạn. Thay vì chỉ trở lại một lớp, nó tạo ra phiên bản được rút gọn của hình ảnh gốc, trong đó mỗi pixel có lớp riêng của nó. Sau đó, nó có một lớp hồi quy dự đoán chính xác vị trí và kích thước của các hộp giới hạn. Bạn có thể bắt đầu với một trình phân loại được đào tạo trước, và sau đó sửa đổi nó thành một mạng YOLO và đào tạo lại nó. Quy trình này được mô tả trong the original paper about YOLO
Tôi thích YOLO vì nó có cấu trúc đơn giản, so với các mạng phát hiện khác, nó cho phép bạn sử dụng học chuyển từ mạng phân loại (dễ đào tạo hơn) và tốc độ phát hiện rất nhanh. Nó thực sự được phát triển để phát hiện thời gian thực trong video.
Có một implementation of YOLO in TensorFlow, nếu bạn muốn tránh sử dụng khung tùy chỉnh darknet được các tác giả của YOLO sử dụng.
Nguồn
2017-03-23 15:21:27