RandomZoom 层

[源代码]

RandomZoom

tf_keras.layers.RandomZoom(
    height_factor,
    width_factor=None,
    fill_mode="reflect",
    interpolation="bilinear",
    seed=None,
    fill_value=0.0,
    **kwargs
)

一个在训练期间随机缩放图像的预处理图层。

此图层将独立地在图像的每个轴上随机放大或缩小,并根据 fill_mode 填充空白区域。

输入像素值可以是任意范围(例如 [0., 1.)[0, 255]),并且可以是整数或浮点 dtype。默认情况下,该层将输出浮点数。

有关预处理层的概述和完整列表,请参阅预处理 指南

参数

  • height_factor:一个以数值分数表示的浮点数,或者一个表示垂直缩放的下限和上限的长度为 2 的元组。当表示为单个浮点数时,该值将同时用于上限和下限。正值表示缩小,负值表示放大。例如,height_factor=(0.2, 0.3) 会导致输出在 [+20%, +30%] 的范围内随机缩小。height_factor=(-0.3, -0.2) 会导致输出在 [+20%, +30%] 的范围内随机放大。
  • width_factor:一个以数值分数表示的浮点数,或者一个表示水平缩放的下限和上限的长度为 2 的元组。当表示为单个浮点数时,该值将同时用于上限和下限。例如,width_factor=(0.2, 0.3) 会导致输出在 20% 到 30% 之间缩小。width_factor=(-0.3, -0.2) 会导致输出在 20% 到 30% 之间放大。None 表示按比例缩放,即垂直和水平方向的缩放比例相同。默认为 None
  • fill_mode: 输入边界之外的点根据给定模式({"constant", "reflect", "wrap", "nearest"} 之一)进行填充。
    • reflect: (d c b a | a b c d | d c b a) 输入通过对最后一个像素的边缘进行反射来扩展。
    • constant: (k k k k | a b c d | k k k k) 输入通过用相同的常量值 k = 0 填充边缘之外的所有值来扩展。
    • wrap: (a b c d | a b c d | a b c d) 输入通过环绕到对面边缘来扩展。
    • nearest: (a a a a | a b c d | d d d d) 输入通过最近的像素进行扩展。
  • interpolation:插值模式。支持的值:"nearest""bilinear"
  • seed:整数。用于创建随机种子。
  • fill_value:一个浮点数,表示当 fill_mode="constant" 时用于填充边界之外的值。

示例

>>> input_img = np.random.random((32, 224, 224, 3))
>>> layer = tf.keras.layers.RandomZoom(.5, .2)
>>> out_img = layer(input_img)
>>> out_img.shape
TensorShape([32, 224, 224, 3])

输入形状

3D(非批量)或 4D(批量)张量,形状为:(..., height, width, channels),采用 "channels_last" 格式。

输出形状

3D(非批量)或 4D(批量)张量,形状为:(..., height, width, channels),采用 "channels_last" 格式。