AveragePooling2D 类tf_keras.layers.AveragePooling2D(
pool_size=(2, 2), strides=None, padding="valid", data_format=None, **kwargs
)
用于空间数据的平均池化操作。
通过对输入窗口(大小由pool_size定义)中每个输入通道的平均值进行计算,沿着输入的高度和宽度这两个空间维度进行下采样。窗口沿着每个维度以strides进行移动。
当使用 "valid" 填充选项时,最终输出的形状(行或列的数量)为:output_shape = math.floor((input_shape - pool_size) / strides) + 1 (当 input_shape >= pool_size 时)
当使用 "same" 填充选项时,结果输出形状为:output_shape = math.floor((input_shape - 1) / strides) + 1
例如,对于 strides=(1, 1) 和 padding="valid"
>>> x = tf.constant([[1., 2., 3.],
... [4., 5., 6.],
... [7., 8., 9.]])
>>> x = tf.reshape(x, [1, 3, 3, 1])
>>> avg_pool_2d = tf.keras.layers.AveragePooling2D(pool_size=(2, 2),
... strides=(1, 1), padding='valid')
>>> avg_pool_2d(x)
<tf.Tensor: shape=(1, 2, 2, 1), dtype=float32, numpy=
array([[[[3.],
[4.]],
[[6.],
[7.]]]], dtype=float32)>
例如,对于 stride=(2, 2) 和 padding="valid"
>>> x = tf.constant([[1., 2., 3., 4.],
... [5., 6., 7., 8.],
... [9., 10., 11., 12.]])
>>> x = tf.reshape(x, [1, 3, 4, 1])
>>> avg_pool_2d = tf.keras.layers.AveragePooling2D(pool_size=(2, 2),
... strides=(2, 2), padding='valid')
>>> avg_pool_2d(x)
<tf.Tensor: shape=(1, 1, 2, 1), dtype=float32, numpy=
array([[[[3.5],
[5.5]]]], dtype=float32)>
例如,对于 strides=(1, 1) 和 padding="same"
>>> x = tf.constant([[1., 2., 3.],
... [4., 5., 6.],
... [7., 8., 9.]])
>>> x = tf.reshape(x, [1, 3, 3, 1])
>>> avg_pool_2d = tf.keras.layers.AveragePooling2D(pool_size=(2, 2),
... strides=(1, 1), padding='same')
>>> avg_pool_2d(x)
<tf.Tensor: shape=(1, 3, 3, 1), dtype=float32, numpy=
array([[[[3.],
[4.],
[4.5]],
[[6.],
[7.],
[7.5]],
[[7.5],
[8.5],
[9.]]]], dtype=float32)>
参数
(2, 2) 将会在两个空间维度上将输入减半。如果只指定一个整数,则两个维度将使用相同的窗口长度。pool_size。"valid" 或 "same"(不区分大小写)之一。"valid" 表示无填充。"same" 会在输入的左/右或上/下进行均匀填充,使得输出与输入具有相同的高度/宽度维度。channels_last(默认)或 channels_first 之一。输入中维度的顺序。channels_last 对应于形状为 (batch, height, width, channels) 的输入,而 channels_first 对应于形状为 (batch, channels, height, width) 的输入。当未指定时,使用您 TF-Keras 配置文件 ~/.keras/keras.json 中的 image_data_format 值(如果存在),否则默认为 'channels_last'。默认为 'channels_last'。输入形状
data_format='channels_last':形状为 (batch_size, rows, cols, channels) 的 4D 张量。data_format='channels_first':形状为 (batch_size, channels, rows, cols) 的 4D 张量。输出形状
data_format='channels_last':4D 张量,形状为 (batch_size, pooled_rows, pooled_cols, channels)。data_format='channels_first':4D 张量,形状为 (batch_size, channels, pooled_rows, pooled_cols)。