Conv2D 类keras.layers.Conv2D(
filters,
kernel_size,
strides=(1, 1),
padding="valid",
data_format=None,
dilation_rate=(1, 1),
groups=1,
activation=None,
use_bias=True,
kernel_initializer="glorot_uniform",
bias_initializer="zeros",
kernel_regularizer=None,
bias_regularizer=None,
activity_regularizer=None,
kernel_constraint=None,
bias_constraint=None,
**kwargs
)
2D 卷积层。
此层创建一个卷积核,该卷积核与层输入在 2D 空间(或时间)维度(高度和宽度)上进行卷积,以产生输出张量。如果 use_bias 为 True,则会创建一个偏置向量并加到输出上。最后,如果 activation 不为 None,它也会应用于输出。
关于数值精度的说明:虽然通常情况下 Keras 操作的执行结果在 float32 的 1e-7 精度范围内跨后端是相同的,但 Conv2D 操作可能会显示出更大的差异。由于卷积操作中包含大量逐元素乘法和加法,特别是对于大型输入或卷积核尺寸,累积的浮点数差异可能会超过 1e-7 的阈值。当使用不同后端(例如 TensorFlow vs JAX)或不同硬件时,这些差异尤其明显。
参数
strides > 1 与 dilation_rate > 1 不兼容。"valid" 或 "same"(不区分大小写)。"valid" 表示不填充。"same" 会在输入的左/右或上/下均匀填充。当 padding="same" 且 strides=1 时,输出与输入大小相同。"channels_last" 或 "channels_first"。输入中的维度顺序。"channels_last" 对应于形状为 (batch_size, height, width, channels) 的输入,而 "channels_first" 对应于形状为 (batch_size, channels, height, width) 的输入。它默认为您 Keras 配置文件 ~/.keras/keras.json 中的 image_data_format 值。如果您从未设置过,则默认为 "channels_last"。filters // groups 个滤波器进行卷积。输出是所有 groups 结果沿通道轴的连接。输入通道和 filters 都必须能被 groups 整除。None,则不应用激活。True,则会将偏置添加到输出中。None,将使用默认初始化器("glorot_uniform")。None,将使用默认初始化器("zeros")。Optimizer 更新后应用(例如,用于实现层权重的范数约束或值约束)。该函数必须以未投影的变量作为输入,并返回投影后的变量(其形状必须相同)。在进行异步分布式训练时,使用约束是不安全的。Optimizer 更新偏置后应用于偏置。输入形状
data_format="channels_last":形状为 (batch_size, height, width, channels) 的 4D 张量data_format="channels_first":形状为 (batch_size, channels, height, width) 的 4D 张量输出形状
data_format="channels_last":形状为 (batch_size, new_height, new_width, filters) 的 4D 张量data_format="channels_first":形状为 (batch_size, filters, new_height, new_width) 的 4D 张量返回
一个 4D 张量,表示 activation(conv2d(inputs, kernel) + bias)。
引发
strides > 1 和 dilation_rate > 1 都存在时。示例
>>> x = np.random.rand(4, 10, 10, 128)
>>> y = keras.layers.Conv2D(32, 3, activation='relu')(x)
>>> print(y.shape)
(4, 8, 8, 32)