Keras 2 API 文档 / 层 API / 卷积层 / Conv3D 层

Conv3D 层

[源]

Conv3D

tf_keras.layers.Conv3D(
    filters,
    kernel_size,
    strides=(1, 1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1, 1),
    groups=1,
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

3D 卷积层(例如,对体数据进行空间卷积)。

此层创建用于与层输入进行卷积的卷积核,以产生输出张量。如果 use_bias 为 True,则会创建并向输出添加偏置向量。最后,如果 activation 不是 None,则也会将其应用于输出。

在模型中使用此层作为第一层时,请提供关键字参数 input_shape(整数元组或 None,不包含样本轴),例如,对于在 data_format="channels_last" 下具有单个通道的 128x128x128 体数据,应指定 input_shape=(128, 128, 128, 1)

示例

>>> # The inputs are 28x28x28 volumes with a single channel, and the
>>> # batch size is 4
>>> input_shape =(4, 28, 28, 28, 1)
>>> x = tf.random.normal(input_shape)
>>> y = tf.keras.layers.Conv3D(
... 2, 3, activation='relu', input_shape=input_shape[1:])(x)
>>> print(y.shape)
(4, 26, 26, 26, 2)
>>> # With extended batch shape [4, 7], e.g. a batch of 4 videos of
>>> # 3D frames, with 7 frames per video.
>>> input_shape = (4, 7, 28, 28, 28, 1)
>>> x = tf.random.normal(input_shape)
>>> y = tf.keras.layers.Conv3D(
... 2, 3, activation='relu', input_shape=input_shape[2:])(x)
>>> print(y.shape)
(4, 7, 26, 26, 26, 2)

参数

  • filters:整数,输出空间的维度(即卷积中的输出滤波器数量)。
  • kernel_size:整数或由 3 个整数组成的元组/列表,指定 3D 卷积窗口的深度、高度和宽度。可以是单个整数,为所有空间维度指定相同的值。
  • strides:整数或由 3 个整数组成的元组/列表,指定沿每个空间维度的卷积步长。可以是单个整数,为所有空间维度指定相同的值。指定任何步长值 != 1 与指定任何 dilation_rate 值 != 1 不兼容。
  • padding"valid""same" 之一(不区分大小写)。"valid" 表示无填充。"same" 表示在输入的左/右或上/下均匀填充零,使得输出的高度/宽度维度与输入相同。
  • data_format:字符串,channels_last(默认)或 channels_first 之一。输入中维度的顺序。channels_last 对应于形状为 batch_shape + (spatial_dim1, spatial_dim2, spatial_dim3, channels) 的输入,而 channels_first 对应于形状为 batch_shape + (channels, spatial_dim1, spatial_dim2, spatial_dim3) 的输入。如果未指定,则使用 TF-Keras 配置文件 ~/.keras/keras.json(如果存在)中的 image_data_format 值,否则使用 'channels_last'。请注意,TensorFlow 在 CPU 上目前不支持 channels_first 格式。默认为 'channels_last'。
  • dilation_rate:整数或由 3 个整数组成的元组/列表,指定用于空洞卷积的空洞率。可以是单个整数,为所有空间维度指定相同的值。目前,指定任何 dilation_rate 值 != 1 与指定任何步长值 != 1 不兼容。
  • groups:正整数,指定沿通道轴将输入分割成的组数。每组都独立地与 filters / groups 个滤波器进行卷积。输出是沿通道轴的所有 groups 结果的串联。输入通道和 filters 都必须能被 groups 整除。
  • activation:要使用的激活函数。如果未指定任何内容,则不应用激活(参见 keras.activations)。
  • use_bias:布尔值,指示层是否使用偏置向量。
  • kernel_initializerkernel 权重矩阵的初始化器(参见 keras.initializers)。默认为 'glorot_uniform'。
  • bias_initializer:偏置向量的初始化器(参见 keras.initializers)。默认为 'zeros'。
  • kernel_regularizer:应用于 kernel 权重矩阵的正则化函数(参见 keras.regularizers)。
  • bias_regularizer:应用于偏置向量的正则化函数(参见 keras.regularizers)。
  • activity_regularizer:应用于层输出(其“激活”)的正则化函数(参见 keras.regularizers)。
  • kernel_constraint:应用于核矩阵的约束函数(参见 keras.constraints)。
  • bias_constraint:应用于偏置向量的约束函数(参见 keras.constraints)。

输入形状

形状为 5+维张量:如果 data_format='channels_first',形状为 batch_shape + (channels, conv_dim1, conv_dim2, conv_dim3);如果 data_format='channels_last',形状为 batch_shape + (conv_dim1, conv_dim2, conv_dim3, channels)

输出形状

形状为 5+维张量:如果 data_format='channels_first',形状为 batch_shape + (filters, new_conv_dim1, new_conv_dim2, new_conv_dim3);如果 data_format='channels_last',形状为 batch_shape + (new_conv_dim1, new_conv_dim2, new_conv_dim3, filters)。由于填充,new_conv_dim1new_conv_dim2new_conv_dim3 的值可能会发生变化。

返回值

一个表示 activation(conv3d(inputs, kernel) + bias) 的 5+维张量。

抛出异常

  • ValueError:如果 padding 为 "causal"。
  • ValueError:当 strides > 1dilation_rate > 1 同时成立时。