Keras 2 API 文档 / 层 API / 卷积层 / DepthwiseConv2D 层

DepthwiseConv2D 层

[源代码]

DepthwiseConv2D

tf_keras.layers.DepthwiseConv2D(
    kernel_size,
    strides=(1, 1),
    padding="valid",
    depth_multiplier=1,
    data_format=None,
    dilation_rate=(1, 1),
    activation=None,
    use_bias=True,
    depthwise_initializer="glorot_uniform",
    bias_initializer="zeros",
    depthwise_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    depthwise_constraint=None,
    bias_constraint=None,
    **kwargs
)

逐层 2D 卷积。

逐层卷积是一种卷积类型,其中每个输入通道都使用不同的卷积核(称为逐层卷积核)进行卷积。你可以将逐层卷积理解为逐层可分离卷积的第一步。

它通过以下步骤实现:

  • 将输入拆分成单独的通道。
  • 使用一个具有 depth_multiplier 输出通道的独立逐层卷积核对每个通道进行卷积。
  • 沿着通道轴将卷积输出拼接起来。

与常规 2D 卷积不同,逐层卷积不会混合不同输入通道之间的信息。

参数 depth_multiplier 决定了应用于一个输入通道的滤波器数量。因此,它控制了在逐层步骤中每个输入通道生成的输出通道数量。

参数

  • kernel_size:一个整数或包含 2 个整数的元组/列表,指定 2D 卷积窗口的高度和宽度。可以是单个整数,为所有空间维度指定相同的值。
  • strides:一个整数或包含 2 个整数的元组/列表,指定卷积沿高度和宽度的步长。可以是单个整数,为所有空间维度指定相同的值。当前实现仅支持行和列维度上的相等步长。指定任何不等于 1 的步长值与指定任何不等于 1 的 dilation_rate 值不兼容。
  • padding'valid''same' 之一(不区分大小写)。"valid" 表示不进行填充。"same" 表示在输入的左/右或上/下均匀填充零,以使输出与输入具有相同的高度/宽度维度。
  • depth_multiplier:每个输入通道的逐层卷积输出通道数量。逐层卷积输出通道的总数将等于 filters_in * depth_multiplier
  • data_format:一个字符串,channels_last(默认)或 channels_first 之一。输入维度的顺序。channels_last 对应于形状为 (batch_size, height, width, channels) 的输入,而 channels_first 对应于形状为 (batch_size, channels, height, width) 的输入。如果未指定,则使用 TF-Keras 配置文件 ~/.keras/keras.json 中找到的 image_data_format 值(如果存在),否则为 'channels_last'。默认为 'channels_last'。
  • dilation_rate:一个整数或包含 2 个整数的元组/列表,指定用于空洞卷积的扩张率。目前,指定任何不等于 1 的 dilation_rate 值与指定任何不等于 1 的 strides 值不兼容。
  • activation:要使用的激活函数。如果未指定,则不应用任何激活(参见 keras.activations)。
  • use_bias:布尔值,表示层是否使用偏置向量。
  • depthwise_initializer:逐层卷积核矩阵的初始化器(参见 keras.initializers)。如果为 None,将使用默认初始化器('glorot_uniform')。
  • bias_initializer:偏置向量的初始化器(参见 keras.initializers)。如果为 None,将使用默认初始化器('zeros')。
  • depthwise_regularizer:应用于逐层卷积核矩阵的正则化函数(参见 keras.regularizers)。
  • bias_regularizer:应用于偏置向量的正则化函数(参见 keras.regularizers)。
  • activity_regularizer:应用于层输出(其“激活”)的正则化函数(参见 keras.regularizers)。
  • depthwise_constraint:应用于逐层卷积核矩阵的约束函数(参见 keras.constraints)。
  • bias_constraint:应用于偏置向量的约束函数(参见 keras.constraints)。

输入形状

如果 data_format='channels_first',则形状为 [batch_size, channels, rows, cols] 的 4D 张量;如果 data_format='channels_last',则形状为 [batch_size, rows, cols, channels] 的 4D 张量。

输出形状

如果 data_format='channels_first',则形状为 [batch_size, channels * depth_multiplier, new_rows, new_cols] 的 4D 张量;如果 data_format='channels_last',则形状为 [batch_size, new_rows, new_cols, channels * depth_multiplier] 的 4D 张量。rowscols 的值可能由于填充而改变。

返回值

一个 4 阶张量,表示 activation(depthwiseconv2d(inputs, kernel) + bias)

抛出

  • ValueError:如果 padding 是 "causal"。
  • ValueError:当 strides > 1 和 dilation_rate > 1 同时指定时。