Keras 2 API文档 / 层API / 卷积层 / Conv2DTranspose层

Conv2DTranspose 层

[源代码]

Conv2DTranspose

tf_keras.layers.Conv2DTranspose(
    filters,
    kernel_size,
    strides=(1, 1),
    padding="valid",
    output_padding=None,
    data_format=None,
    dilation_rate=(1, 1),
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

转置卷积层(有时称为反卷积)。

转置卷积的需求通常源于希望使用与正常卷积相反方向的变换,即从具有某些卷积输出形状的东西变换到具有其输入形状的东西,同时保持与该卷积兼容的连接模式。

当将此层作为模型的第一层使用时,请提供关键字参数 input_shape(整数或 None 的元组,不包含样本轴),例如,对于 128x128 RGB 图像,在 data_format="channels_last" 时,使用 input_shape=(128, 128, 3)

参数

  • filters:整数,输出空间的维度(即卷积中的输出滤波器数量)。
  • kernel_size:一个整数或包含 2 个整数的元组/列表,指定 2D 卷积窗口的高度和宽度。可以是一个整数,为所有空间维度指定相同的值。
  • strides:一个整数或 2 个整数的元组/列表,指定卷积在高度和宽度方向上的步幅。可以是一个整数,为所有空间维度指定相同的值。指定任何步幅值 != 1 都与指定任何 dilation_rate 值 != 1 不兼容。
  • padding"valid""same" 之一(不区分大小写)。"valid" 表示不进行填充。"same" 会在输入的左/右或上/下均匀地填充零,从而使输出具有与输入相同的宽度/高度维度。
  • output_padding:一个整数或 2 个整数的元组/列表,指定输出张量在高度和宽度上的填充量。可以是一个整数,为所有空间维度指定相同的值。在给定维度上的输出填充量必须小于该维度上的步幅。如果设置为 None(默认值),则推断输出形状。
  • data_format:一个字符串,值为 channels_last(默认)或 channels_first。输入中维度的顺序。channels_last 对应于形状为 (batch_size, height, width, channels) 的输入,而 channels_first 对应于形状为 (batch_size, channels, height, width) 的输入。当未指定时,使用 Keras 配置文件 ~/.keras/keras.json 中找到的 image_data_format 值(如果存在),否则默认为 'channels_last'。默认为 "channels_last"。
  • dilation_rate:一个整数,指定所有空间维度的扩张率,用于扩张卷积。不支持为不同维度指定不同的扩张率。目前,指定任何 dilation_rate 值 != 1 都与指定任何步幅值 != 1 不兼容。
  • activation:要使用的激活函数。如果您不指定任何内容,则不应用激活(请参阅 keras.activations)。
  • use_bias:布尔值,表示该层是否使用偏置向量。
  • kernel_initializerkernel 权重矩阵的初始化器(请参阅 keras.initializers)。默认为 'glorot_uniform'。
  • bias_initializer:偏置向量的初始化器(请参阅 keras.initializers)。默认为 'zeros'。
  • kernel_regularizer:应用于 kernel 权重矩阵的正则化函数(请参阅 keras.regularizers)。
  • bias_regularizer:应用于偏置向量的正则化函数(请参阅 keras.regularizers)。
  • activity_regularizer:应用于层输出(其“激活”)的正则化函数(请参阅 keras.regularizers)。
  • kernel_constraint:应用于核矩阵的约束函数(请参阅 keras.constraints)。
  • bias_constraint:应用于偏置向量的约束函数(请参阅 keras.constraints)。

输入形状

4D 张量,形状为:如果 data_format='channels_first',则为 (batch_size, channels, rows, cols);如果 data_format='channels_last',则为 (batch_size, rows, cols, channels)

输出形状

4D 张量,形状为:如果 data_format='channels_first',则为 (batch_size, filters, new_rows, new_cols);如果 data_format='channels_last',则为 (batch_size, new_rows, new_cols, filters)rowscols 的值可能因填充而改变。如果指定了 output_padding

new_rows = ((rows - 1) * strides[0] + kernel_size[0] - 2 * padding[0] +
output_padding[0])
new_cols = ((cols - 1) * strides[1] + kernel_size[1] - 2 * padding[1] +
output_padding[1])

返回

一个秩为 4 的张量,表示 activation(conv2dtranspose(inputs, kernel) + bias)

引发

  • ValueError:如果 padding 为 "causal"。 ("因果")
  • ValueError:当 strides > 1 且 dilation_rate > 1 时。

参考文献