GridMask
类keras_cv.layers.GridMask(
ratio_factor=(0, 0.5),
rotation_factor=0.15,
fill_mode="constant",
fill_value=0.0,
seed=None,
**kwargs
)
用于网格掩码增强的 GridMask 类。
输入形状
值在 [0, 255] 范围内的整数或浮点数张量。3D(未批处理)或 4D(已批处理)张量,形状为:(..., height, width, channels)
,采用 "channels_last"
格式
输出形状
3D(未批处理)或 4D(已批处理)张量,形状为:(..., height, width, channels)
,采用 "channels_last"
格式
参数
ratio_factor: 浮点数、两个浮点数的元组或 keras_cv.FactorSampler
。比率决定了间距到网格掩码的比例。较低的值使网格尺寸变小,较高的值使网格掩码变大。浮点数应在 [0, 1] 范围内。0.5 表示网格和间距将具有相同的尺寸。要始终使用相同的值,请传递 keras_cv.src.ConstantFactorSampler()
。
默认为 (0, 0.5)
。 - rotation_factor: rotation_factor 将用于在训练期间随机旋转 grid_mask。默认为 0.1,这将导致输出旋转随机量,范围为 [-10% * 2pi, 10% * 2pi]。
以 2 Pi 的分数表示的浮点数,或大小为 2 的元组,表示顺时针和逆时针旋转的下限和上限。正值表示逆时针旋转,负值表示顺时针旋转。当表示为单个浮点数时,此值用于上限和下限。例如,factor=(-0.2, 0.3) 会导致输出旋转随机量,范围为 [-20% * 2pi, 30% * 2pi]。factor=0.2 会导致输出旋转随机量,范围为 [-20% * 2pi, 20% * 2pi]。 - __ fill_mode__: 网格块内的像素根据给定的模式填充({"constant", "gaussian_noise"}
之一),默认为 "constant"。 - constant: 像素填充相同常数值。 - gaussian_noise: 像素填充随机高斯噪声。 - fill_value: 当 fill_mode="constant"
时,表示填充到网格块内的值的整数。有效整数范围 [0 到 255] - seed: 整数。用于创建随机种子。
示例
(images, labels), _ = keras.datasets.cifar10.load_data()
random_gridmask = keras_cv.layers.preprocessing.GridMask()
augmented_images = random_gridmask(images)
参考文献