Keras 3 API 文档 / 层 API / 卷积层 / Conv3D 层

Conv3D 层

[源代码]

Conv3D

keras.layers.Conv3D(
    filters,
    kernel_size,
    strides=(1, 1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1, 1),
    groups=1,
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

3D 卷积层。

此层创建一个卷积核,该卷积核在 3D 空间(或时间)维度(宽度、高度和深度)上与层输入进行卷积,以生成输出张量。如果 use_bias 为 True,则会创建偏差向量并将其添加到输出中。最后,如果 activation 不为 None,则将其应用于输出。

参数

  • filters:整数,输出空间的维度(卷积中滤波器的数量)。
  • kernel_size:整数或包含 3 个整数的元组/列表,指定卷积窗口的大小。
  • strides:整数或包含 3 个整数的元组/列表,指定卷积的步长。strides > 1dilation_rate > 1 不兼容。
  • padding:字符串,可以是 "valid""same"(不区分大小写)。"valid" 表示不填充。"same" 会导致在输入的左右或上下均匀填充。当 padding="same"strides=1 时,输出的大小与输入相同。
  • data_format:字符串,可以是 "channels_last""channels_first"。输入中维度的顺序。"channels_last" 对应于形状为 (batch_size, spatial_dim1, spatial_dim2, spatial_dim3, channels) 的输入,而 "channels_first" 对应于形状为 (batch_size, channels, spatial_dim1, spatial_dim2, spatial_dim3) 的输入。它默认为 Keras 配置文件(位于 ~/.keras/keras.json)中找到的 image_data_format 值。如果您从未设置过它,则它将为 "channels_last"
  • dilation_rate:整数或包含 3 个整数的元组/列表,指定用于膨胀卷积的膨胀率。
  • groups:一个正整数,指定输入沿通道轴分割的组数。每组分别与 filters // groups 个滤波器进行卷积。输出是所有 groups 结果沿通道轴的连接。输入通道和 filters 都必须能被 groups 整除。
  • activation:激活函数。如果为 None,则不应用任何激活函数。
  • use_bias:布尔值,如果为 True,则将偏差添加到输出中。
  • kernel_initializer:卷积核的初始化器。如果为 None,则将使用默认初始化器("glorot_uniform")。
  • bias_initializer:偏差向量的初始化器。如果为 None,则将使用默认初始化器("zeros")。
  • kernel_regularizer:卷积核的可选正则化器。
  • bias_regularizer:偏差向量的可选正则化器。
  • activity_regularizer:输出的可选正则化函数。
  • kernel_constraint:可选投影函数,应用于由 Optimizer 更新后的内核(例如,用于实现层权重的范数约束或值约束)。该函数必须以未投影变量作为输入,并必须返回投影变量(必须具有相同的形状)。在进行异步分布式训练时,约束的使用不安全。
  • bias_constraint:可选投影函数,应用于由 Optimizer 更新后的偏差。

输入形状

  • 如果 data_format="channels_last":5D 张量,形状为:(batch_size, spatial_dim1, spatial_dim2, spatial_dim3, channels)
  • 如果 data_format="channels_first":5D 张量,形状为:(batch_size, channels, spatial_dim1, spatial_dim2, spatial_dim3)

输出形状

  • 如果 data_format="channels_last":5D 张量,形状为:(batch_size, new_spatial_dim1, new_spatial_dim2, new_spatial_dim3, filters)
  • 如果 data_format="channels_first":5D 张量,形状为:(batch_size, filters, new_spatial_dim1, new_spatial_dim2, new_spatial_dim3)

返回值

表示 activation(conv3d(inputs, kernel) + bias) 的 5D 张量。

引发异常

  • ValueError:当 strides > 1dilation_rate > 1 同时出现时。

示例

>>> x = np.random.rand(4, 10, 10, 10, 128)
>>> y = keras.layers.Conv3D(32, 3, activation='relu')(x)
>>> print(y.shape)
(4, 8, 8, 8, 32)