Keras 2 API 文档 / 层 API / 循环层 / ConvLSTM1D 层

ConvLSTM1D 层

[源代码]

ConvLSTM1D

tf_keras.layers.ConvLSTM1D(
    filters,
    kernel_size,
    strides=1,
    padding="valid",
    data_format=None,
    dilation_rate=1,
    activation="tanh",
    recurrent_activation="hard_sigmoid",
    use_bias=True,
    kernel_initializer="glorot_uniform",
    recurrent_initializer="orthogonal",
    bias_initializer="zeros",
    unit_forget_bias=True,
    kernel_regularizer=None,
    recurrent_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    recurrent_constraint=None,
    bias_constraint=None,
    return_sequences=False,
    return_state=False,
    go_backwards=False,
    stateful=False,
    dropout=0.0,
    recurrent_dropout=0.0,
    **kwargs
)

一维卷积 LSTM。

类似于 LSTM 层,但输入变换和循环变换都是卷积运算。

参数

  • filters:整数,输出空间的维度(即卷积中的输出过滤器数量)。
  • kernel_size:整数或包含 n 个整数的元组/列表,指定卷积窗口的维度。
  • strides:整数或包含 n 个整数的元组/列表,指定卷积的步长。指定任何 != 1 的步长值与指定任何 dilation_rate 值不兼容。
  • padding"valid""same" 之一(不区分大小写)。"valid" 表示无填充。"same" 会在输入的左/右均匀填充,以便输出与输入具有相同的长度维度。
  • data_format:字符串,channels_last(默认)或 channels_first 之一。输入中维度的顺序。channels_last 对应于形状为 (batch, time, ..., channels) 的输入,而 channels_first 对应于形状为 (batch, time, channels, ...) 的输入。未指定时,使用在 TF-Keras 配置文件 ~/.keras/keras.json(如果存在)中的 image_data_format 值,否则为 'channels_last'。默认为 'channels_last'。
  • dilation_rate:整数或包含 n 个整数的元组/列表,指定扩张卷积使用的扩张率。目前,指定任何 != 1 的 dilation_rate 值与指定任何 != 1 的 strides 值不兼容。
  • activation:要使用的激活函数。默认应用双曲正切激活函数(tanh(x))。
  • recurrent_activation:循环步要使用的激活函数。
  • use_bias:布尔值,层是否使用偏置向量。
  • kernel_initializerkernel 权重矩阵的初始化器,用于输入的线性变换。
  • recurrent_initializerrecurrent_kernel 权重矩阵的初始化器,用于循环状态的线性变换。
  • bias_initializer:偏置向量的初始化器。
  • unit_forget_bias:布尔值。如果为 True,则在初始化时向遗忘门的偏置项添加 1。与 bias_initializer="zeros" 结合使用。这在 Jozefowicz 等人,2015 年中被推荐。
  • kernel_regularizer:应用于 kernel 权重矩阵的正则化函数。
  • recurrent_regularizer:应用于 recurrent_kernel 权重矩阵的正则化函数。
  • bias_regularizer:应用于偏置向量的正则化函数。
  • activity_regularizer:应用于输出的正则化函数。
  • kernel_constraint:应用于 kernel 权重矩阵的约束函数。
  • recurrent_constraint:应用于 recurrent_kernel 权重矩阵的约束函数。
  • bias_constraint:应用于偏置向量的约束函数。
  • return_sequences:布尔值。是返回输出序列中的最后一个输出,还是返回整个序列。(默认 False)
  • return_state:布尔值。除了输出外,是否返回最终状态。(默认 False)
  • go_backwards:布尔值(默认 False)。如果为 True,则反向处理输入序列。
  • stateful:布尔值(默认 False)。如果为 True,则一个批次中索引 i 的每个样本的最终状态将用作下一个批次中索引 i 的样本的初始状态。
  • dropout:0 到 1 之间的浮点数。用于输入线性变换的单元丢弃比例。
  • recurrent_dropout:0 到 1 之间的浮点数。用于循环状态线性变换的单元丢弃比例。

调用参数

  • inputs:一个 4D 张量。
  • mask:形状为 (samples, timesteps) 的二进制张量,指示是否应屏蔽给定时间步。
  • training:Python 布尔值,指示层应在训练模式还是推断模式下运行。此参数在调用单元时传递。仅当设置了 dropoutrecurrent_dropout 时才相关。
  • initial_state:初始状态张量的列表,传递给单元的第一次调用。

输入形状 - 如果 data_format='channels_first'

形状为 (samples, time, channels, rows) 的 4D 张量 - 如果 data_format='channels_last',形状为 (samples, time, rows, channels) 的 4D 张量

输出形状

  • 如果 return_state 为 True:张量列表。第一个张量是输出。其余张量是最终状态,每个都是 3D 张量,如果 data_format='channels_first',形状为 (samples, filters, new_rows);如果 data_format='channels_last',形状为 (samples, new_rows, filters)rows 的值可能由于填充而改变。
  • 如果 return_sequences 为 True:形状为 (samples, timesteps, filters, new_rows) 的 4D 张量(如果 data_format='channels_first')或形状为 (samples, timesteps, new_rows, filters) 的 4D 张量(如果 data_format='channels_last')。
  • 否则,3D 张量,如果 data_format='channels_first',形状为 (samples, filters, new_rows);如果 data_format='channels_last',形状为 (samples, new_rows, filters)

引发异常

  • ValueError:构造函数参数无效时。

参考文献