RandomZoom
类keras.layers.RandomZoom(
height_factor,
width_factor=None,
fill_mode="reflect",
interpolation="bilinear",
seed=None,
fill_value=0.0,
data_format=None,
**kwargs
)
一个在训练期间随机缩放图像的预处理层。
此层将独立地随机缩放图像的每个轴,并根据 fill_mode
填充空白区域。
输入像素值可以是任意范围(例如 [0., 1.)
或 [0, 255]
),并且可以是整数或浮点 dtype。默认情况下,该层将输出浮点数。
输入形状
3D (未批处理) 或 4D (已批处理) 张量,形状为:(..., height, width, channels)
,格式为 "channels_last"
,或 (..., channels, height, width)
,格式为 "channels_first"
。
输出形状
3D (未批处理) 或 4D (已批处理) 张量,形状为:(..., target_height, target_width, channels)
,或 (..., channels, target_height, target_width)
,格式为 "channels_first"
。
注意: 此层可以安全地在 tf.data
管道中使用(与您使用的后端无关)。
参数
height_factor=(0.2, 0.3)
导致输出在 [+20%, +30%]
范围内随机缩小。height_factor=(-0.3, -0.2)
导致输出在 [+20%, +30%]
范围内随机放大。width_factor=(0.2, 0.3)
导致输出在 20% 到 30% 之间缩小。width_factor=(-0.3, -0.2)
导致输出在 20% 到 30% 之间放大。None
表示保持宽高比缩放垂直和水平方向。默认为 None
。"constant"
、"nearest"
、"wrap"
和 "reflect"
。默认为 "constant"
。"reflect"
:(d c b a | a b c d | d c b a)
输入通过反射最后一个像素的边缘进行扩展。"constant"
:(k k k k | a b c d | k k k k)
输入通过用 fill_value
指定的相同常数值 k 填充边缘以外的所有值进行扩展。"wrap"
:(a b c d | a b c d | a b c d)
输入通过环绕到相反的边缘进行扩展。"nearest"
:(a a a a | a b c d | d d d d)
输入通过最近的像素进行扩展。请注意,当使用 torch 后端时,"reflect"
会重定向到 "mirror"
(c d c b | a b c d | c b a b)
,因为 torch 不支持 "reflect"
。请注意,torch 后端不支持 "wrap"
。"nearest"
、"bilinear"
。fill_mode="constant"
时在边界外填充的值。"channels_last"
或 "channels_first"
。输入中维度的顺序。"channels_last"
对应于形状为 (batch, height, width, channels)
的输入,而 "channels_first"
对应于形状为 (batch, channels, height, width)
的输入。它默认为您的 Keras 配置文件 ~/.keras/keras.json
中找到的 image_data_format
值。如果您从未设置它,则它将为 "channels_last"
。name
和 dtype
。示例
>>> input_img = np.random.random((32, 224, 224, 3))
>>> layer = keras.layers.RandomZoom(.5, .2)
>>> out_img = layer(input_img)