KerasHub:预训练模型 / API 文档 / 模型架构 / VGG / VGGBackbone 模型

VGGBackbone 模型

[源代码]

VGGBackbone

keras_hub.models.VGGBackbone(
    stackwise_num_repeats, stackwise_num_filters, image_shape=(None, None, 3), **kwargs
)

此类表示 VGG 模型的 Keras Backbone。

此类实现了 用于大规模图像识别的非常深层卷积网络(ICLR 2015) 中描述的 VGG backbone。

参数

  • stackwise_num_repeats:整数列表,每个 VGG 块中重复的卷积块的数量。对于 VGG16,此值为 [2, 2, 3, 3, 3];对于 VGG19,此值为 [2, 2, 4, 4, 4]。
  • stackwise_num_filters:整数列表,每个 VGG 块中卷积块的过滤器大小。对于 VGG16 和 VGG19,此值均为 [64, 128, 256, 512, 512]。
  • image_shape:元组,可选形状元组,默认为 (None, None, 3)。

示例

input_data = np.ones((2, 224, 224, 3), dtype="float32")

# Pretrained VGG backbone.
model = keras_hub.models.VGGBackbone.from_preset("vgg_16_imagenet")
model(input_data)

# Randomly initialized VGG backbone with a custom config.
model = keras_hub.models.VGGBackbone(
    stackwise_num_repeats = [2, 2, 3, 3, 3],
    stackwise_num_filters = [64, 128, 256, 512, 512],
    image_shape = (224, 224, 3),
)
model(input_data)

[源代码]

from_preset 方法

VGGBackbone.from_preset(preset, load_weights=True, **kwargs)

从模型预设实例化一个 keras_hub.models.Backbone

预设是一个包含配置、权重和其他文件资源的目录,用于保存和加载预训练模型。preset 可以作为以下之一传递:

  1. 一个内置的预设标识符,如 'bert_base_en'
  2. 一个 Kaggle Models 句柄,如 'kaggle://user/bert/keras/bert_base_en'
  3. 一个 Hugging Face 句柄,如 'hf://user/bert_base_en'
  4. 一个本地预设目录的路径,如 './bert_base_en'

此构造函数可以通过两种方式调用。可以从基类调用,如 keras_hub.models.Backbone.from_preset();也可以从模型类调用,如 keras_hub.models.GemmaBackbone.from_preset()。如果从基类调用,则返回对象的子类将根据预设目录中的配置推断。

对于任何 Backbone 子类,您可以运行 cls.presets.keys() 来列出该类上所有可用的内置预设。

参数

  • preset:字符串。一个内置预设标识符、一个 Kaggle Models 句柄、一个 Hugging Face 句柄或一个本地目录的路径。
  • load_weights:布尔值。如果为 `True`,权重将被加载到模型架构中。如果为 `False`,权重将被随机初始化。

示例

# Load a Gemma backbone with pre-trained weights.
model = keras_hub.models.Backbone.from_preset(
    "gemma_2b_en",
)

# Load a Bert backbone with a pre-trained config and random weights.
model = keras_hub.models.Backbone.from_preset(
    "bert_base_en",
    load_weights=False,
)
预设 参数 描述
vgg_11_imagenet 9.22M 11 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。
vgg_13_imagenet 9.40M 13 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。
vgg_16_imagenet 14.71M 16 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。
vgg_19_imagenet 20.02M 19 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。