2016-08-16 15 views
5

Tôi đã học sâu với CNN một thời gian và tôi nhận ra rằng các yếu tố đầu vào cho một mô hình luôn là hình ảnh bình phương.Tại sao đầu vào cho mạng nơ-ron xoắn ốc luôn luôn bình phương?

Tôi thấy rằng cả hoạt động chập hoặc hoạt động của cấu trúc mạng nơron đều không yêu cầu thuộc tính đó.

Vì vậy, lý do cho điều đó là gì?

Đánh giá cao bất kỳ nhận xét nào!

Trả lời

1

Vì hình ảnh vuông đẹp mắt. Nhưng có các ứng dụng trên hình ảnh phi vuông khi miền yêu cầu. Ví dụ: tập dữ liệu gốc SVHN là hình ảnh của một vài chữ số và do đó hình ảnh hình chữ nhật được sử dụng làm đầu vào cho convnet, như here

1

Không nhất thiết phải có hình vuông. Tôi thấy hai "lý do" cho nó:

  • rộng: Nếu hình ảnh được thu nhỏ tự động từ một tỉ lệ (và cảnh quan/chế độ chân dung) này trung bình có thể giới thiệu các lỗi ít nhất
  • ấn/visualizations: hình ảnh vuông rất dễ để hiển thị cùng
1

Từ Suhas Pillai:

vấn đề là không phải với lớp xoắn, đó là kết nối đầy đủ các lớp của mạng, yêu cầu sửa số nơron.Đối với ví dụ , hãy lấy một lớp 3 lớp nhỏ + lớp softmax. Nếu đầu tiên 2 các lớp là convolutional + max pooling, giả định kích thước là cùng trước và sau khi convolution, và gộp làm giảm mờ/2, đó là thường là trường hợp. Đối với hình ảnh 3 * 32 * 32 (C, W, H) với 4 bộ lọc trong lớplớp đầu tiên và 6 bộ lọc trong lớp thứ hai, đầu ra sau chập chững + tối đa tổng hợp ở cuối lớp thứ 2, sẽ là 6 * 8 * 8 , trong khi đối với hình ảnh có 3 * 64 * 64, ở cuối đầu ra lớp thứ hai sẽ là 6 * 16 * 16. Trước khi thực hiện kết nối hoàn toàn, chúng tôi kéo giãn nó thành một vector đơn (6 * 8 * 8 = 384 nơron) và thực hiện một thao tác được kết nối hoàn toàn. Vì vậy, bạn không thể có các lớp kết nối đầy đủ kích thước khác nhau cho các hình ảnh có kích thước khác nhau. Một cách để giải quyết vấn đề này là sử dụng kim tự tháp không gian tổng hợp, nơi bạn buộc đầu ra của lớp xoắn ốc cuối cùng sang gộp nó vào một số thùng cố định (các nơron I.e) sao cho lớp hoàn chỉnh có cùng số nơ-ron. Bạn cũng có thể kiểm tra đầy đủ mạng chuyển đổi, có thể chụp ảnh không vuông.

Các vấn đề liên quan