Conv2D
类keras.layers.Conv2D(
filters,
kernel_size,
strides=(1, 1),
padding="valid",
data_format=None,
dilation_rate=(1, 1),
groups=1,
activation=None,
use_bias=True,
kernel_initializer="glorot_uniform",
bias_initializer="zeros",
kernel_regularizer=None,
bias_regularizer=None,
activity_regularizer=None,
kernel_constraint=None,
bias_constraint=None,
**kwargs
)
2D 卷积层。
这一层创建一个卷积核,该卷积核在 2D 空间(或时间)维度(高度和宽度)上与层输入进行卷积,生成一个输出张量。如果 use_bias
为 True,则会创建一个偏置向量并将其添加到输出中。最后,如果 activation
不是 None
,则也会将其应用于输出。
关于数值精度的注意事项:通常情况下,Keras 操作在不同后端上的执行结果在 float32 精度下可达到 1e-7 的一致性,但 Conv2D
操作可能会显示出更大的差异。由于卷积操作中存在大量的元素乘法和加法,尤其是在输入或卷积核尺寸较大时,累积的浮点差异可能会超出 1e-7 的阈值。当使用不同的后端(例如 TensorFlow 与 JAX)或不同的硬件时,这些差异尤其明显。
参数
strides > 1
时,与 dilation_rate > 1
不兼容。"valid"
或 "same"
(不区分大小写)。"valid"
表示无填充。"same"
表示在输入的左/右或上/下均匀填充。当 padding="same"
且 strides=1
时,输出尺寸与输入相同。"channels_last"
或 "channels_first"
。输入的维度顺序。"channels_last"
对应于形状为 (batch_size, height, width, channels)
的输入,而 "channels_first"
对应于形状为 (batch_size, channels, height, width)
的输入。它默认为你的 Keras 配置文件 ~/.keras/keras.json
中 image_data_format
的值。如果你从未设置过,则默认为 "channels_last"
。filters // groups
个卷积核进行卷积。输出是所有 groups
结果沿通道轴的拼接。输入通道数和 filters
都必须能被 groups
整除。None
,则不应用激活函数。True
,则会向输出中添加偏置向量。None
,将使用默认的初始化器("glorot_uniform"
)。None
,将使用默认的初始化器("zeros"
)。Optimizer
更新后应用(例如,用于实现层权重的范数约束或值约束)。该函数必须将未投影的变量作为输入,并返回投影后的变量(其形状必须相同)。在执行异步分布式训练时,使用约束函数是不安全的。Optimizer
更新后应用。输入形状
data_format="channels_last"
:形状为 (batch_size, height, width, channels)
的 4D 张量。data_format="channels_first"
:形状为 (batch_size, channels, height, width)
的 4D 张量。输出形状
data_format="channels_last"
:形状为 (batch_size, new_height, new_width, filters)
的 4D 张量。data_format="channels_first"
:形状为 (batch_size, filters, new_height, new_width)
的 4D 张量。返回值
表示 activation(conv2d(inputs, kernel) + bias)
的 4D 张量。
异常
strides > 1
和 dilation_rate > 1
同时成立时。示例
>>> x = np.random.rand(4, 10, 10, 128)
>>> y = keras.layers.Conv2D(32, 3, activation='relu')(x)
>>> print(y.shape)
(4, 8, 8, 32)