► Keras 3 API 文档 / 层 API / 循环层 / ConvLSTM2D 层

ConvLSTM2D 层

`ConvLSTM2D` 类

keras.layers.ConvLSTM2D(
    filters,
    kernel_size,
    strides=1,
    padding="valid",
    data_format=None,
    dilation_rate=1,
    activation="tanh",
    recurrent_activation="sigmoid",
    use_bias=True,
    kernel_initializer="glorot_uniform",
    recurrent_initializer="orthogonal",
    bias_initializer="zeros",
    unit_forget_bias=True,
    kernel_regularizer=None,
    recurrent_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    recurrent_constraint=None,
    bias_constraint=None,
    dropout=0.0,
    recurrent_dropout=0.0,
    seed=None,
    return_sequences=False,
    return_state=False,
    go_backwards=False,
    stateful=False,
    **kwargs
)

2D 卷积 LSTM。

与 LSTM 层类似，但输入变换和循环变换都是卷积的。

参数

filters：int，输出空间的维度（卷积中的过滤器数量）。
kernel_size：整数或包含 2 个整数的元组/列表，指定卷积窗口的大小。
strides：整数或包含 2 个整数的元组/列表，指定卷积的步长。strides > 1 与 dilation_rate > 1 不兼容。
padding：字符串，"valid" 或 "same" (不区分大小写)。"valid" 表示不填充。"same" 导致在输入张量的左/右或上/下均匀填充，使得输出张量具有与输入相同的行/列维度。
data_format：字符串，"channels_last" 或 "channels_first"。输入中维度的顺序。"channels_last" 对应形状为 (batch, steps, features) 的输入，而 "channels_first" 对应形状为 (batch, features, steps) 的输入。它默认为 Keras 配置文件 ~/.keras/keras.json 中 image_data_format 的值。如果你从未设置过，则默认为 "channels_last"。
dilation_rate：整数或包含 2 个整数的元组/列表，指定用于扩张卷积的扩张率。
activation：要使用的激活函数。默认应用双曲正切激活函数 (tanh(x))。
recurrent_activation：用于循环步骤的激活函数。
use_bias：布尔值，表示层是否使用偏置向量。
kernel_initializer：kernel 权重矩阵的初始化器，用于输入的线性变换。
recurrent_initializer：recurrent_kernel 权重矩阵的初始化器，用于循环状态的线性变换。
bias_initializer：偏置向量的初始化器。
unit_forget_bias：布尔值。如果为 True，在初始化时向遗忘门的偏置加上 1。与 bias_initializer="zeros" 结合使用。这在 Jozefowicz 等人，2015 中推荐。
kernel_regularizer：应用于 kernel 权重矩阵的正则化函数。
recurrent_regularizer：应用于 recurrent_kernel 权重矩阵的正则化函数。
bias_regularizer：应用于偏置向量的正则化函数。
activity_regularizer：应用于输出的正则化函数。
kernel_constraint：应用于 kernel 权重矩阵的约束函数。
recurrent_constraint：应用于 recurrent_kernel 权重矩阵的约束函数。
bias_constraint：应用于偏置向量的约束函数。
dropout：介于 0 和 1 之间的浮点数。用于输入线性变换的单元丢弃率。
recurrent_dropout：介于 0 和 1 之间的浮点数。用于循环状态线性变换的单元丢弃率。
seed：丢弃层的随机种子。
return_sequences：布尔值。是否返回输出序列中的最后一个输出，还是返回整个序列。默认值：False。
return_state：布尔值。除了输出之外，是否返回最后一个状态。默认值：False。
go_backwards：布尔值（默认值：False）。如果为 True，则反向处理输入序列并返回反向序列。
stateful：布尔值（默认值：False）。如果为 True，则批次中索引 i 处每个样本的最后一个状态将用作下一个批次中索引 i 处样本的初始状态。
unroll：布尔值（默认值：False）。如果为 True，网络将展开，否则将使用符号循环。展开可以加速 RNN，但往往更占用内存。展开只适用于短序列。

调用参数

inputs：一个 5D 张量。
mask：形状为 (samples, timesteps) 的二进制张量，指示给定时间步是否应被掩码。
training：Python 布尔值，指示层应在训练模式下还是在推断模式下运行。这仅在设置了 dropout 或 recurrent_dropout 时相关。
initial_state：要传递给单元第一次调用的初始状态张量列表。

输入形状

如果 data_format='channels_first'：形状为 (samples, time, channels, rows, cols) 的 5D 张量
如果 data_format='channels_last'：形状为 (samples, time, rows, cols, channels) 的 5D 张量

输出形状

如果 return_state：张量列表。第一个张量是输出。其余张量是最后一个状态，每个都是 4D 张量，如果 data_format='channels_first'，形状为 (samples, filters, new_rows, new_cols)；如果 data_format='channels_last'，形状为 (samples, new_rows, new_cols, filters)。rows 和 cols 值可能因填充而改变。
如果 return_sequences：如果 data_format='channels_first'，形状为 (samples, timesteps, filters, new_rows, new_cols) 的 5D 张量；如果 data_format='channels_last'，形状为 (samples, timesteps, new_rows, new_cols, filters) 的 5D 张量。
否则，如果 data_format='channels_first'，形状为 (samples, filters, new_rows, new_cols) 的 4D 张量；如果 data_format='channels_last'，形状为 (samples, new_rows, new_cols, filters) 的 4D 张量。

参考文献

Shi 等人，2015 (当前实现不包括单元输出上的反馈循环)。

ConvLSTM2D 层

ConvLSTM2D 类

ConvLSTM2D 层

ConvLSTM2D 类

`ConvLSTM2D` 类