Keras 3 API文档 / 层API / 卷积层 / Conv3DTranspose 层

Conv3DTranspose 层

[源代码]

Conv3DTranspose

keras.layers.Conv3DTranspose(
    filters,
    kernel_size,
    strides=(1, 1, 1),
    padding="valid",
    data_format=None,
    output_padding=None,
    dilation_rate=(1, 1, 1),
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

3D转置卷积层。

转置卷积通常是为了实现与普通卷积相反方向的变换,即从一个具有卷积输出形状的张量转换到具有卷积输入形状的张量,同时保持与该卷积兼容的连接模式。

参数

  • filters: int,输出空间的维度(转置卷积中的滤波器数量)。
  • kernel_size:int 或 1 个整数的元组/列表,指定转置卷积窗口的大小。
  • strides:int 或 1 个整数的元组/列表,指定转置卷积的步长。strides > 1dilation_rate > 1 不兼容。
  • padding: string,可以是 "valid""same"(不区分大小写)。"valid" 表示不填充。"same" 会在输入两侧或上下均匀地填充。当 padding="same"strides=1 时,输出大小与输入大小相同。output_padding: 一个整数或一个包含3个整数的元组/列表,指定深度、高度和宽度方向的填充量。可以是一个整数,为所有空间维度指定相同的值。沿给定维度的输出填充量必须小于沿同一维度的步幅。如果设置为 None(默认值),则推断输出形状。
  • data_format: string,可以是 "channels_last""channels_first"。输入中的维度顺序。"channels_last" 对应形状为 (batch_size, spatial_dim1, spatial_dim2, spatial_dim3, channels) 的输入,而 "channels_first" 对应形状为 (batch_size, channels, spatial_dim1, spatial_dim2, spatial_dim3) 的输入。默认值为 Keras 配置文件 ~/.keras/keras.json 中的 image_data_format 值。如果从未设置过,则默认为 "channels_last"
  • dilation_rate:一个整数或 3 个整数的元组/列表,指定用于扩张卷积的扩张率。可以是单个整数,用于指定所有空间维度的相同值。目前,指定任何大于 1 的 dilation_rate 值都与指定任何大于 1 的步幅值不兼容。
  • activation:激活函数。如果为 None,则不应用激活。
  • use_bias:bool,如果为 True,则会将偏置添加到输出中。
  • kernel_initializer:卷积核的初始化器。如果为 None,将使用默认初始化器("glorot_uniform")。
  • bias_initializer:偏置向量的初始化器。如果为 None,将使用默认初始化器("zeros")。
  • kernel_regularizer:卷积核的可选正则化器。
  • bias_regularizer:偏置向量的可选正则化器。
  • activity_regularizer:输出的可选正则化函数。
  • kernel_constraint: 可选的投影函数,在卷积核被 Optimizer 更新后应用(例如,用于实现层权重的范数约束或值约束)。该函数必须以未投影的变量作为输入,并返回投影后的变量(其形状必须相同)。在进行异步分布式训练时,使用约束是不安全的。
  • bias_constraint:可选的投影函数,用于在 Optimizer 更新偏置后应用于偏置。

输入形状

  • 如果 data_format="channels_last": 形状为 (batch_size, spatial_dim1, spatial_dim2, spatial_dim3, channels) 的 5D 张量
  • 如果 data_format="channels_first": 形状为 (batch_size, channels, spatial_dim1, spatial_dim2, spatial_dim3) 的 5D 张量

输出形状

  • 如果 data_format="channels_last":5D张量,形状为:(batch_size, new_spatial_dim1, new_spatial_dim2, new_spatial_dim3, filters)
  • 如果 data_format="channels_first":5D张量,形状为:(batch_size, filters, new_spatial_dim1, new_spatial_dim2, new_spatial_dim3)

返回

一个5D张量,表示 activation(conv3d(inputs, kernel) + bias)

引发

  • ValueError:当 strides > 1dilation_rate > 1 都存在时。

参考文献

示例

>>> x = np.random.rand(4, 10, 8, 12, 128)
>>> y = keras.layers.Conv3DTranspose(32, 2, 2, activation='relu')(x)
>>> print(y.shape)
(4, 20, 16, 24, 32)