► Keras 3 API 文档 / KerasCV / 模型 / 骨干网络 / EfficientNetV2 模型

EfficientNetV2 模型

`EfficientNetV2Backbone` 类

keras_cv.models.EfficientNetV2Backbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
width_coefficient：浮点数，网络宽度的缩放系数。
depth_coefficient：浮点数，网络深度的缩放系数。
stackwise_kernel_sizes：整数列表，用于每个卷积块的内核大小。
stackwise_num_repeats：整数列表，每个卷积块的重复次数。
stackwise_input_filters：整数列表，每个卷积块的输入过滤器数量。
stackwise_output_filters：整数列表，卷积块模型中每个堆栈的输出过滤器数量。
stackwise_expansion_ratios：浮点数列表，传递给挤压和激励块的扩展比率。
stackwise_squeeze_and_excite_ratios：整数列表，传递给挤压和激励块的挤压和激励比率。
stackwise_strides：整数列表，每个卷积块的步长。
stackwise_conv_types：字符串列表。每个值都是 'unfused' 或 'fused'，具体取决于所需的块。FusedMBConvBlock 类似于 MBConvBlock，但融合块使用单个 3x3 卷积块，而不是使用深度卷积和 1x1 输出卷积块。
skip_connection_dropout：浮点数，跳过连接时的 dropout 率。
depth_divisor：整数，网络宽度的一个单位。
min_depth：整数，最小过滤器数量。
activation：每个卷积层之间使用的激活函数。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 keras.layers.Input() 的输出），用作模型的图像输入。

示例

# Construct an EfficientNetV2 from a preset:
efficientnet = keras_cv.models.EfficientNetV2Backbone.from_preset(
    "efficientnetv2_s"
)
images = tf.ones((1, 256, 256, 3))
outputs = efficientnet.predict(images)

# Alternatively, you can also customize the EfficientNetV2 architecture:
model = EfficientNetV2Backbone(
    stackwise_kernel_sizes=[3, 3, 3, 3, 3, 3],
    stackwise_num_repeats=[2, 4, 4, 6, 9, 15],
    stackwise_input_filters=[24, 24, 48, 64, 128, 160],
    stackwise_output_filters=[24, 48, 64, 128, 160, 256],
    stackwise_expansion_ratios=[1, 4, 4, 4, 6, 6],
    stackwise_squeeze_and_excite_ratios=[0.0, 0.0, 0, 0.25, 0.25, 0.25],
    stackwise_strides=[1, 2, 2, 2, 1, 2],
    stackwise_conv_types=[
        "fused",
        "fused",
        "fused",
        "unfused",
        "unfused",
        "unfused",
    ],
    width_coefficient=1.0,
    depth_coefficient=1.0,
    include_rescaling=False,
)
images = tf.ones((1, 256, 256, 3))
outputs = efficientnet.predict(images)

[源代码]

`from_preset` 方法

EfficientNetV2Backbone.from_preset()

从预设配置和权重实例化 EfficientNetV2Backbone 模型。

参数

preset：字符串。必须是 "efficientnetv2_s"、"efficientnetv2_m"、"efficientnetv2_l"、"efficientnetv2_b0"、"efficientnetv2_b1"、"efficientnetv2_b2"、"efficientnetv2_b3"、"efficientnetv2_s_imagenet"、"efficientnetv2_b0_imagenet"、"efficientnetv2_b1_imagenet"、"efficientnetv2_b2_imagenet" 之一。如果要查找具有预训练权重的预设，请选择 "efficientnetv2_s_imagenet"、"efficientnetv2_b0_imagenet"、"efficientnetv2_b1_imagenet"、"efficientnetv2_b2_imagenet" 之一。
load_weights：是否将预训练权重加载到模型中。默认为 None，这取决于预设是否有可用的预训练权重。

示例

# Load architecture and weights from preset
model = keras_cv.models.EfficientNetV2Backbone.from_preset(
    "efficientnetv2_s_imagenet",
)

# Load randomly initialized model from preset architecture with weights
model = keras_cv.models.EfficientNetV2Backbone.from_preset(
    "efficientnetv2_s_imagenet",
    load_weights=False,

预设名称	参数	描述
efficientnetv2_s	20.33M	具有 6 个卷积块的 EfficientNet 架构。
efficientnetv2_m	53.15M	具有 7 个卷积块的 EfficientNet 架构。
efficientnetv2_l	117.75M	具有 7 个卷积块的 EfficientNet 架构，但在 `efficientnetv2_m` 中具有更多过滤器。
efficientnetv2_b0	5.92M	具有 6 个卷积块的 EfficientNet B 风格架构。此 B 风格模型具有 `width_coefficient=1.0` 和 `depth_coefficient=1.0`。
efficientnetv2_b1	6.93M	具有 6 个卷积块的 EfficientNet B 风格架构。此 B 风格模型具有 `width_coefficient=1.0` 和 `depth_coefficient=1.1`。
efficientnetv2_b2	8.77M	具有 6 个卷积块的 EfficientNet B 风格架构。此 B 风格模型具有 `width_coefficient=1.1` 和 `depth_coefficient=1.2`。
efficientnetv2_b3	12.93M	具有 7 个卷积块的 EfficientNet B 风格架构。此 B 风格模型具有 `width_coefficient=1.2` 和 `depth_coefficient=1.4`。
efficientnetv2_s_imagenet	20.33M	具有 6 个卷积块的 EfficientNet 架构。权重初始化为预训练的 ImageNet 分类权重。已发布的权重能够在 ImageNet 上获得 83.9% 的 top 1 准确率和 96.7% 的 top 5 准确率。
efficientnetv2_b0_imagenet	5.92M	具有 6 个卷积块的 EfficientNet B 风格架构。此 B 风格模型具有 `width_coefficient=1.0` 和 `depth_coefficient=1.0`。权重初始化为预训练的 ImageNet 分类权重。已发布的权重能够在 ImageNet 上获得 77.1% 的 top 1 准确率和 93.3% 的 top 5 准确率。
efficientnetv2_b1_imagenet	6.93M	具有 6 个卷积块的 EfficientNet B 风格架构。此 B 风格模型具有 `width_coefficient=1.0` 和 `depth_coefficient=1.1`。权重初始化为预训练的 ImageNet 分类权重。已发布的权重能够在 ImageNet 上获得 79.1% 的 top 1 准确率和 94.4% 的 top 5 准确率。
efficientnetv2_b2_imagenet	8.77M	具有 6 个卷积块的 EfficientNet B 风格架构。此 B 风格模型具有 `width_coefficient=1.1` 和 `depth_coefficient=1.2`。权重初始化为预训练的 ImageNet 分类权重。已发布的权重能够在 ImageNet 上获得 80.1% 的 top 1 准确率和 94.9% 的 top 5 准确率。

[源代码]

`EfficientNetV2B0Backbone` 类

keras_cv.models.EfficientNetV2B0Backbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2B0 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 layers.Input() 的输出），用作模型的图像输入。

[源代码]

`EfficientNetV2B1Backbone` 类

keras_cv.models.EfficientNetV2B1Backbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2B1 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 layers.Input() 的输出），用作模型的图像输入。

[源代码]

`EfficientNetV2B2Backbone` 类

keras_cv.models.EfficientNetV2B2Backbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2B2 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 layers.Input() 的输出），用作模型的图像输入。

[源代码]

`EfficientNetV2B3Backbone` 类

keras_cv.models.EfficientNetV2B3Backbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2B3 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 layers.Input() 的输出），用作模型的图像输入。

[源代码]

`EfficientNetV2SBackbone` 类

keras_cv.models.EfficientNetV2SBackbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2S 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 layers.Input() 的输出），用作模型的图像输入。

[源代码]

`EfficientNetV2MBackbone` 类

keras_cv.models.EfficientNetV2MBackbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2M 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 layers.Input() 的输出），用作模型的图像输入。

[源代码]

`EfficientNetV2LBackbone` 类

keras_cv.models.EfficientNetV2LBackbone(
    include_rescaling,
    width_coefficient,
    depth_coefficient,
    stackwise_kernel_sizes,
    stackwise_num_repeats,
    stackwise_input_filters,
    stackwise_output_filters,
    stackwise_expansion_ratios,
    stackwise_squeeze_and_excite_ratios,
    stackwise_strides,
    stackwise_conv_types,
    skip_connection_dropout=0.2,
    depth_divisor=8,
    min_depth=8,
    activation="swish",
    input_shape=(None, None, 3),
    input_tensor=None,
    **kwargs
)

实例化 EfficientNetV2L 架构。

参考

EfficientNetV2：更小的模型和更快的训练 (ICML 2021)

参数

include_rescaling：布尔值，是否重新缩放输入。如果设置为 True，则输入将通过 Rescaling(1/255.0) 层。
input_shape：可选的形状元组，默认为 (None, None, 3)。
input_tensor：可选的 Keras 张量（即 layers.Input() 的输出），用作模型的图像输入。

EfficientNetV2 模型

EfficientNetV2Backbone 类

from_preset 方法

EfficientNetV2B0Backbone 类

EfficientNetV2B1Backbone 类

EfficientNetV2B2Backbone 类

EfficientNetV2B3Backbone 类

EfficientNetV2SBackbone 类

EfficientNetV2MBackbone 类

EfficientNetV2LBackbone 类

EfficientNetV2 模型

EfficientNetV2Backbone 类

from_preset 方法

EfficientNetV2B0Backbone 类

EfficientNetV2B1Backbone 类

EfficientNetV2B2Backbone 类

EfficientNetV2B3Backbone 类

EfficientNetV2SBackbone 类

EfficientNetV2MBackbone 类

EfficientNetV2LBackbone 类

`EfficientNetV2Backbone` 类

`from_preset` 方法

`EfficientNetV2B0Backbone` 类

`EfficientNetV2B1Backbone` 类

`EfficientNetV2B2Backbone` 类

`EfficientNetV2B3Backbone` 类

`EfficientNetV2SBackbone` 类

`EfficientNetV2MBackbone` 类

`EfficientNetV2LBackbone` 类