Conv2D
类keras.layers.Conv2D(
filters,
kernel_size,
strides=(1, 1),
padding="valid",
data_format=None,
dilation_rate=(1, 1),
groups=1,
activation=None,
use_bias=True,
kernel_initializer="glorot_uniform",
bias_initializer="zeros",
kernel_regularizer=None,
bias_regularizer=None,
activity_regularizer=None,
kernel_constraint=None,
bias_constraint=None,
**kwargs
)
2D 卷积层。
此层创建一个卷积核,该卷积核与层输入在 2D 空间(或时间)维度(高度和宽度)上进行卷积,以生成输出张量。如果 use_bias
为 True,则会创建一个偏置向量并将其添加到输出中。最后,如果 activation
不是 None
,则也会将其应用于输出。
关于数值精度的注意事项:虽然通常情况下,Keras 操作执行结果在 float32 中在 1e-7 精度范围内在后端之间是相同的,但 Conv2D
操作可能会显示更大的差异。由于卷积运算中存在大量的逐元素乘法和加法,尤其是在输入或内核尺寸较大时,累积的浮点差异可能会超过 1e-7 阈值。当使用不同的后端(例如,TensorFlow 与 JAX)或不同的硬件时,这些差异尤其明显。
参数
strides > 1
与 dilation_rate > 1
不兼容。"valid"
或 "same"
(不区分大小写)。"valid"
表示无填充。"same"
会在输入的左/右或上/下均匀填充。当 padding="same"
且 strides=1
时,输出与输入具有相同的大小。"channels_last"
或 "channels_first"
。输入中维度的顺序。"channels_last"
对应于形状为 (batch_size, height, width, channels)
的输入,而 "channels_first"
对应于形状为 (batch_size, channels, height, width)
的输入。它默认为在您的 Keras 配置文件 ~/.keras/keras.json
中找到的 image_data_format
值。如果您从未设置它,则它将为 "channels_last"
。filters // groups
个滤波器分别进行卷积。输出是沿通道轴的所有 groups
结果的串联。输入通道和 filters
都必须能被 groups
整除。None
,则不应用激活函数。True
,则会将偏置添加到输出中。None
,将使用默认初始化器 ("glorot_uniform"
)。None
,将使用默认初始化器 ("zeros"
)。Optimizer
更新内核后应用于内核(例如,用于为层权重实现范数约束或值约束)。该函数必须将未投影的变量作为输入,并且必须返回投影的变量(其必须具有相同的形状)。当进行异步分布式训练时,约束是不安全的。Optimizer
更新偏置后应用于偏置。输入形状
data_format="channels_last"
:形状为 (batch_size, height, width, channels)
的 4D 张量data_format="channels_first"
:形状为 (batch_size, channels, height, width)
的 4D 张量输出形状
data_format="channels_last"
:形状为 (batch_size, new_height, new_width, filters)
的 4D 张量data_format="channels_first"
:形状为 (batch_size, filters, new_height, new_width)
的 4D 张量返回
表示 activation(conv2d(inputs, kernel) + bias)
的 4D 张量。
引发
strides > 1
和 dilation_rate > 1
时。示例
>>> x = np.random.rand(4, 10, 10, 128)
>>> y = keras.layers.Conv2D(32, 3, activation='relu')(x)
>>> print(y.shape)
(4, 8, 8, 32)