KerasHub: 预训练模型 / API 文档 / 模型架构 / VGG / VGGBackbone 模型

VGGBackbone 模型

[源代码]

VGGBackbone

keras_hub.models.VGGBackbone(
    stackwise_num_repeats, stackwise_num_filters, image_shape=(None, None, 3), **kwargs
)

此类表示 Keras VGG 模型的骨干网络。

此类实现了 用于大规模图像识别的非常深的卷积网络 (ICLR 2015) 中描述的 VGG 骨干网络。

参数

  • stackwise_num_repeats: 整数列表,每个 VGG 块中重复卷积块的数量。对于 VGG16,这是 [2, 2, 3, 3, 3];对于 VGG19,这是 [2, 2, 4, 4, 4]。
  • stackwise_num_filters: 整数列表,每个 VGG 块中卷积块的过滤器大小。对于 VGG16 和 VGG19,这都是 [64, 128, 256, 512, 512]。
  • image_shape: 元组,可选的形状元组,默认为 (None, None, 3)。

示例

input_data = np.ones((2, 224, 224, 3), dtype="float32")

# Pretrained VGG backbone.
model = keras_hub.models.VGGBackbone.from_preset("vgg_16_imagenet")
model(input_data)

# Randomly initialized VGG backbone with a custom config.
model = keras_hub.models.VGGBackbone(
    stackwise_num_repeats = [2, 2, 3, 3, 3],
    stackwise_num_filters = [64, 128, 256, 512, 512],
    image_shape = (224, 224, 3),
)
model(input_data)

[源代码]

from_preset 方法

VGGBackbone.from_preset(preset, load_weights=True, **kwargs)

从模型预设实例化 keras_hub.models.Backbone

预设是用于保存和加载预训练模型的配置、权重和其他文件资产的目录。preset 可以是以下之一:

  1. 内置预设标识符,例如 'bert_base_en'
  2. Kaggle Models 句柄,例如 'kaggle://user/bert/keras/bert_base_en'
  3. Hugging Face 句柄,例如 'hf://user/bert_base_en'
  4. 本地预设目录的路径,例如 './bert_base_en'

此构造函数可以通过两种方式之一调用。可以从基类调用,例如 keras_hub.models.Backbone.from_preset();或者从模型类调用,例如 keras_hub.models.GemmaBackbone.from_preset()。如果从基类调用,则返回对象的子类将从预设目录中的配置中推断出来。

对于任何 Backbone 子类,您都可以运行 cls.presets.keys() 来列出该类上所有可用的内置预设。

参数

  • preset: 字符串。内置预设标识符、Kaggle Models 句柄、Hugging Face 句柄或本地目录的路径。
  • load_weights: 布尔值。如果为 True,权重将加载到模型架构中。如果为 False,权重将随机初始化。

示例

# Load a Gemma backbone with pre-trained weights.
model = keras_hub.models.Backbone.from_preset(
    "gemma_2b_en",
)

# Load a Bert backbone with a pre-trained config and random weights.
model = keras_hub.models.Backbone.from_preset(
    "bert_base_en",
    load_weights=False,
)
预设 参数 描述
vgg_11_imagenet 9.22M 在 ImageNet 1k 数据集上以 224x224 分辨率预训练的 11 层 VGG 模型。
vgg_13_imagenet 9.40M 在 ImageNet 1k 数据集上以 224x224 分辨率预训练的 13 层 VGG 模型。
vgg_16_imagenet 14.71M 在 ImageNet 1k 数据集上以 224x224 分辨率预训练的 16 层 VGG 模型。
vgg_19_imagenet 20.02M 在 ImageNet 1k 数据集上以 224x224 分辨率预训练的 19 层 VGG 模型。