► Keras 3 API 文档 / Layers API / 卷积层 / Conv2D 层

Conv2D 层

`Conv2D` 类

keras.layers.Conv2D(
    filters,
    kernel_size,
    strides=(1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1),
    groups=1,
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

2D 卷积层。

此层创建一个卷积核，该卷积核与层输入在 2D 空间（或时间）维度（高度和宽度）上进行卷积，以产生输出张量。如果 use_bias 为 True，则会创建一个偏置向量并加到输出上。最后，如果 activation 不为 None，它也会应用于输出。

关于数值精度的说明：虽然通常情况下 Keras 操作的执行结果在 float32 的 1e-7 精度范围内跨后端是相同的，但 Conv2D 操作可能会显示出更大的差异。由于卷积操作中包含大量逐元素乘法和加法，特别是对于大型输入或卷积核尺寸，累积的浮点数差异可能会超过 1e-7 的阈值。当使用不同后端（例如 TensorFlow vs JAX）或不同硬件时，这些差异尤其明显。

参数

filters：int，输出空间的维度（卷积中的过滤器数量）。
kernel_size：整数或包含 2 个整数的元组/列表，指定卷积窗口的大小。
strides：整数或包含 2 个整数的元组/列表，指定卷积的步长。strides > 1 与 dilation_rate > 1 不兼容。
padding: string，可以是 "valid" 或 "same"（不区分大小写）。"valid" 表示不填充。"same" 会在输入的左/右或上/下均匀填充。当 padding="same" 且 strides=1 时，输出与输入大小相同。
data_format：字符串，可以是 "channels_last" 或 "channels_first"。输入中的维度顺序。"channels_last" 对应于形状为 (batch_size, height, width, channels) 的输入，而 "channels_first" 对应于形状为 (batch_size, channels, height, width) 的输入。它默认为您 Keras 配置文件 ~/.keras/keras.json 中的 image_data_format 值。如果您从未设置过，则默认为 "channels_last"。
dilation_rate：整数或包含 2 个整数的元组/列表，指定用于扩张卷积的扩张率。
groups：一个正整数，指定输入在通道轴上分割成的组数。每组分别与 filters // groups 个滤波器进行卷积。输出是所有 groups 结果沿通道轴的连接。输入通道和 filters 都必须能被 groups 整除。
activation：激活函数。如果为 None，则不应用激活。
use_bias：bool，如果为 True，则会将偏置添加到输出中。
kernel_initializer：卷积核的初始化器。如果为 None，将使用默认初始化器（"glorot_uniform"）。
bias_initializer：偏置向量的初始化器。如果为 None，将使用默认初始化器（"zeros"）。
kernel_regularizer：卷积核的可选正则化器。
bias_regularizer：偏置向量的可选正则化器。
activity_regularizer：输出的可选正则化函数。
kernel_constraint: 可选的投影函数，在卷积核被 Optimizer 更新后应用（例如，用于实现层权重的范数约束或值约束）。该函数必须以未投影的变量作为输入，并返回投影后的变量（其形状必须相同）。在进行异步分布式训练时，使用约束是不安全的。
bias_constraint：可选的投影函数，用于在 Optimizer 更新偏置后应用于偏置。

输入形状

如果 data_format="channels_last"：形状为 (batch_size, height, width, channels) 的 4D 张量
如果 data_format="channels_first"：形状为 (batch_size, channels, height, width) 的 4D 张量

输出形状

如果 data_format="channels_last"：形状为 (batch_size, new_height, new_width, filters) 的 4D 张量
如果 data_format="channels_first"：形状为 (batch_size, filters, new_height, new_width) 的 4D 张量

一个 4D 张量，表示 activation(conv2d(inputs, kernel) + bias)。

引发

ValueError：当 strides > 1 和 dilation_rate > 1 都存在时。

示例

>>> x = np.random.rand(4, 10, 10, 128)
>>> y = keras.layers.Conv2D(32, 3, activation='relu')(x)
>>> print(y.shape)
(4, 8, 8, 32)

Conv2D 层

Conv2D 类

Conv2D 层

Conv2D 类

`Conv2D` 类