2017-08-11 21 views
5

Tôi hiện đang nghiên cứu điều này paper (trang 53), trong đó đề xuất chuyển đổi được thực hiện một cách đặc biệt.Biến tần cơ bản này có được thực hiện trong mạng thần kinh xoắn ốc bình thường không?

Đây là công thức:

enter image description here

Dưới đây là lời giải thích của họ:.

Như hình 4.2, tất cả các bản đồ tính năng đầu vào (giả sử tôi trong tổng số), O_i (i = 1 , · · ·, I) được ánh xạ vào một số bản đồ tính năng (giả sử J trong tổng số), Q_j (j = 1, · · ·, J) trong các lớp convolution dựa trên một số bộ lọc cục bộ (I × J in tổng số), w_ {ij} (i = 1, · · ·, I; j = 1, · · ·, J). Ánh xạ có thể được biểu diễn như là hoạt động chập chững nổi tiếng trong xử lý tín hiệu. Giả sử bản đồ tính năng đầu vào là tất cả một chiều, mỗi đơn vị của một bản đồ tính năng trong lớp convolution có thể được tính như phương trình \ ref {eq: equation} (phương trình trên).

trong đó o_ {i, m} là đơn vị thứ m của bản đồ tính năng đầu vào thứ i O_i, q_ {j, m} là đơn vị thứ m của bản đồ thứ j của biểu đồ tính lớp, w_ {i, j, n} là phần tử thứ n của vectơ trọng số, w_ {i, j}, kết nối bản đồ tính năng thứ i của đầu vào với bản đồ thứ j của lớp convolution và F được gọi là bộ lọc kích thước là số lượng dải đầu vào mà mỗi đơn vị của lớp convolution nhận được.

Cho đến nay rất tốt:

Điều cơ bản tôi hiểu từ đây là những gì tôi đã cố gắng minh họa trong hình ảnh này.

enter image description here

Nó dường như với tôi những gì họ đang làm là thực sự xử lý tất cả dữ liệu chỉ lên đến F, và trên tất cả các bản đồ đặc trưng. Về cơ bản di chuyển theo cả hai hướng x-y, và tính toán trên điểm từ đó.

Về cơ bản đó không phải là 2d- convolution trên hình ảnh có kích thước 2d (I x F) có bộ lọc bằng kích thước hình ảnh không ?. Trọng lượng dường như không khác gì ở tất cả đều có tầm quan trọng ở đây ..?

Vì vậy, tại sao tôi lại yêu cầu này đây ..

Tôi cố gắng để thực hiện điều này, tôi không chắc chắn về những gì họ đang làm, thực sự là chập chỉ là cơ bản, trong đó một thức ăn cửa sổ trượt giữ cho ăn mới dữ liệu, hoặc là những gì họ làm không bình thường convolution, có nghĩa là tôi cần thiết kế một lớp đặc biệt mà hoạt động này? ...

+1

Có khía cạnh liên quan đến lập trình cho câu hỏi này mà chúng tôi có thể trợ giúp không? Hoặc để đặt nó theo một cách khác, bạn đã thử viết mã này ra và đang nhận được kết quả kỳ lạ? MO của trang web này là bạn cung cấp cho chúng tôi một đoạn mã và chúng tôi giúp bạn tìm ra vấn đề. – SeeDerekEngineer

+1

Tôi chỉ cần thêm một công cụ xây dựng trên đó .. @SeeDerekEngineer – Lamda

+1

Điều này sẽ có trên https://stats.stackexchange.com –

Trả lời

4

Có họ chỉ sử dụng các convolution thông thường. Nó có thể dễ dàng hơn cho bạn để xem trang 54, nơi họ đơn giản hóa phương trình. Dưới đây là ảnh chụp màn hình có liên quan:

enter image description here

Như bạn thấy, những gì họ mô tả ở đây chỉ là các nhà điều hành chập điển hình.

+0

Bạn có thể xây dựng một chút về số lượng trọng lượng ma trận trọng lượng đòi hỏi không? một lớp convolution bình thường trong CNN có chia sẻ trọng lượng, mà việc thực hiện chính xác này cũng nên có, nhưng dường như với tôi rằng số lượng trọng lượng trong việc thực hiện này, làm cho mỗi quá trình xử lý rất độc đáo, và do đó không chia sẻ trọng lượng. –

Các vấn đề liên quan