Keras 3 API 文档 / 层 API / 卷积层 / Conv2DTranspose 层

Conv2DTranspose 层

[来源]

Conv2DTranspose

keras.layers.Conv2DTranspose(
    filters,
    kernel_size,
    strides=(1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1),
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

二维转置卷积层。

转置卷积的必要性通常源于希望使用与普通卷积相反方向的变换,即从具有某种卷积输出形状的东西到具有其输入形状的东西,同时保持与该卷积兼容的连接模式。

参数

  • filters: int,输出空间的维度(转置卷积中的滤波器数量)。
  • kernel_size: int 或 1 个整数的元组/列表,指定转置卷积窗口的大小。
  • strides: int 或 1 个整数的元组/列表,指定转置卷积的步长。strides > 1dilation_rate > 1 不兼容。
  • padding: string,要么是 "valid" 要么是 "same"(不区分大小写)。"valid" 表示没有填充。"same" 会在输入的左右或上下进行均匀填充。当 padding="same"strides=1 时,输出的大小与输入相同。
  • data_format: string,要么是 "channels_last" 要么是 "channels_first"。输入中维度的排序。"channels_last" 对应于形状为 (batch_size, height, width, channels) 的输入,而 "channels_first" 对应于形状为 (batch_size, channels, height, width) 的输入。它默认为在您的 Keras 配置文件 ~/.keras/keras.json 中找到的 image_data_format 值。如果您从未设置它,那么它将是 "channels_last"
  • dilation_rate: int 或 1 个整数的元组/列表,指定用于膨胀转置卷积的膨胀率。
  • activation: 激活函数。如果为 None,则不应用任何激活。
  • use_bias: bool,如果为 True,则将在输出中添加偏差。
  • kernel_initializer: 卷积核的初始化器。如果为 None,则将使用默认初始化器 ("glorot_uniform")。
  • bias_initializer: 偏差向量的初始化器。如果为 None,则将使用默认初始化器 ("zeros")。
  • kernel_regularizer: 卷积核的可选正则化器。
  • bias_regularizer: 偏差向量的可选正则化器。
  • activity_regularizer: 输出的可选正则化函数。
  • kernel_constraint: 可选投影函数,应用于由 Optimizer 更新后的内核(例如,用于实现层权重的范数约束或值约束)。该函数必须以未投影变量作为输入,并必须返回投影后的变量(其形状必须相同)。在进行异步分布式训练时,约束的使用不安全。
  • bias_constraint: 可选投影函数,应用于由 Optimizer 更新后的偏差。

输入形状

  • 如果 data_format="channels_last": 形状为 (batch_size, height, width, channels) 的 4D 张量
  • 如果 data_format="channels_first": 形状为 (batch_size, channels, height, width) 的 4D 张量

输出形状

  • 如果 data_format="channels_last": 形状为 (batch_size, new_height, new_width, filters) 的 4D 张量
  • 如果 data_format="channels_first": 形状为 (batch_size, filters, new_height, new_width) 的 4D 张量

返回值

表示 activation(conv2d_transpose(inputs, kernel) + bias) 的 4D 张量。

引发

  • ValueError: 当 strides > 1dilation_rate > 1 同时存在时。

参考

示例

>>> x = np.random.rand(4, 10, 8, 128)
>>> y = keras.layers.Conv2DTranspose(32, 2, 2, activation='relu')(x)
>>> print(y.shape)
(4, 20, 16, 32)