Keras 3 API 文档 / 层 API / 卷积层 / SeparableConv1D 层

SeparableConv1D 层

[源]

SeparableConv1D

keras.layers.SeparableConv1D(
    filters,
    kernel_size,
    strides=1,
    padding="valid",
    data_format=None,
    dilation_rate=1,
    depth_multiplier=1,
    activation=None,
    use_bias=True,
    depthwise_initializer="glorot_uniform",
    pointwise_initializer="glorot_uniform",
    bias_initializer="zeros",
    depthwise_regularizer=None,
    pointwise_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    depthwise_constraint=None,
    pointwise_constraint=None,
    bias_constraint=None,
    **kwargs
)

1D 可分离卷积层。

这一层先执行逐通道卷积(depthwise convolution),该卷积独立作用于每个通道,然后执行逐点卷积(pointwise convolution),该卷积混合各通道的信息。如果 use_bias 为 True 并且提供了偏置项初始化器,它会在输出中添加一个偏置向量。之后,它会选择性地应用激活函数来生成最终输出。

参数

  • filters: int,输出空间的维度(即逐点卷积中的滤波器数量)。
  • kernel_size: int 或包含 1 个整数的元组/列表,指定逐通道卷积窗口的大小。
  • strides: int 或包含 1 个整数的元组/列表,指定逐通道卷积的步长。如果只指定一个 int,则所有维度都使用相同的步长。strides > 1dilation_rate > 1 不兼容。
  • padding: 字符串,可以是 "valid""same" (不区分大小写)。"valid" 表示不进行填充。"same" 表示在输入的左/右或上/下均匀填充。当 padding="same"strides=1 时,输出的大小与输入相同。
  • data_format: 字符串,可以是 "channels_last""channels_first"。输入的维度顺序。"channels_last" 对应于形状为 (batch, steps, features) 的输入,而 "channels_first" 对应于形状为 (batch, features, steps) 的输入。它默认为 Keras 配置文件 ~/.keras/keras.json 中的 image_data_format 值。如果从未设置过,则默认为 "channels_last"
  • dilation_rate: int 或包含 1 个整数的元组/列表,指定用于空洞卷积(dilated convolution)的空洞率。如果只指定一个 int,则所有维度都使用相同的空洞率。
  • depth_multiplier: 每个输入通道的逐通道卷积输出通道数。逐通道卷积输出通道的总数将等于 input_channel * depth_multiplier
  • activation: 激活函数。如果为 None,则不应用激活。
  • use_bias: bool,如果为 True,则会在输出中添加偏置项。
  • depthwise_initializer: 逐通道卷积核的初始化器。如果为 None,则使用默认初始化器 ("glorot_uniform")。
  • pointwise_initializer: 逐点卷积核的初始化器。如果为 None,则使用默认初始化器 ("glorot_uniform")。
  • bias_initializer: 偏置向量的初始化器。如果为 None,则使用默认初始化器 ('"zeros"')。
  • depthwise_regularizer: 逐通道卷积核的可选正则化器。
  • pointwise_regularizer: 逐点卷积核的可选正则化器。
  • bias_regularizer: 偏置向量的可选正则化器。
  • activity_regularizer: 输出的可选正则化函数。
  • depthwise_constraint: 应用于逐通道卷积核的可选投影函数,在被 Optimizer 更新后使用(例如,用于层权重的范数约束或值约束)。该函数必须接收未投影的变量作为输入,并返回投影后的变量(形状必须相同)。
  • pointwise_constraint: 应用于逐点卷积核的可选投影函数,在被 Optimizer 更新后使用。
  • bias_constraint: 应用于偏置项的可选投影函数,在被 Optimizer 更新后使用。

输入形状

  • 如果 data_format="channels_last": 形状为 (batch_shape, steps, channels) 的 3D 张量。
  • 如果 data_format="channels_first": 形状为 (batch_shape, channels, steps) 的 3D 张量。

输出形状

  • 如果 data_format="channels_last": 形状为 (batch_shape, new_steps, filters) 的 3D 张量。
  • 如果 data_format="channels_first": 形状为 (batch_shape, filters, new_steps) 的 3D 张量。

返回值

一个表示 activation(separable_conv1d(inputs, kernel) + bias) 的 3D 张量。

示例

>>> x = np.random.rand(4, 10, 12)
>>> y = keras.layers.SeparableConv1D(3, 4, 3, 2, activation='relu')(x)
>>> print(y.shape)
(4, 4, 4)