2016-07-26 18 views
14

Trong định nghĩa của tf.nn.max_pool, ksize được sử dụng để làm gì?các tập quán của ksize trong tf.nn.max_pool

tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=None) 

Performs the max pooling on the input. 

Args: 

value: A 4-D Tensor with shape [batch, height, width, channels] and type tf.float32. 
ksize: A list of ints that has length >= 4. The size of the window for each dimension of the input tensor. 

Ví dụ, nếu một input valuetensor : [1, 64, 64, 3]ksize=3 .what Điều đó nghĩa là gì?

+0

Mất tối đa trên diện tích có kích thước ksize (kích thước hạt nhân). –

+0

Theo mô tả, ksize chụp kích thước của cửa sổ cho mỗi kích thước của thiết bị đầu vào. Nếu kích thước hàng loạt = 6, ksize = 3, điều đó có nghĩa là maxmum sẽ được thực hiện trên 3 lô cho một hạt nhân gộp không? – user288609

Trả lời

28

Các documentation trạng thái:

ksize: Một danh sách các ints có chiều dài> = 4. Kích thước của cửa sổ cho mỗi chiều của tensor đầu vào.

Nói chung cho hình ảnh, đầu vào của bạn có hình dạng [batch_size, 64, 64, 3] cho hình ảnh RGB có kích thước 64x64 pixel.

Kích thước hạt nhân ksize thường sẽ là [1, 2, 2, 1] nếu bạn có cửa sổ 2x2 mà bạn sử dụng tối đa. Trên thứ nguyên kích thước lô và thứ nguyên kênh, ksize1 vì chúng tôi không muốn lấy tối đa nhiều ví dụ hoặc trên nhiều kênh.

Các vấn đề liên quan