KerasHub:预训练模型 / API文档 / 模型架构 / VGG / VGGBackbone模型

VGGBackbone 模型

[源代码]

VGGBackbone

keras_hub.models.VGGBackbone(
    stackwise_num_repeats, stackwise_num_filters, image_shape=(None, None, 3), **kwargs
)

此类表示 Keras VGG 模型的骨干部分。

此类实现了 Very Deep Convolutional Networks for Large-Scale Image Recognition(ICLR 2015)中描述的 VGG 骨干网络。

参数

  • stackwise_num_repeats:整数列表,每个 VGG 块中重复卷积块的数量。对于 VGG16,它是 [2, 2, 3, 3, 3],对于 VGG19,它是 [2, 2, 4, 4, 4]。
  • stackwise_num_filters:整数列表,每个 VGG 块中卷积块的滤波器大小。对于 VGG16 和 VGG19,它们都是 [ 64, 128, 256, 512, 512]。
  • image_shape:元组,可选的形状元组,默认为 (None, None, 3)。

示例

input_data = np.ones((2, 224, 224, 3), dtype="float32")

# Pretrained VGG backbone.
model = keras_hub.models.VGGBackbone.from_preset("vgg_16_imagenet")
model(input_data)

# Randomly initialized VGG backbone with a custom config.
model = keras_hub.models.VGGBackbone(
    stackwise_num_repeats = [2, 2, 3, 3, 3],
    stackwise_num_filters = [64, 128, 256, 512, 512],
    image_shape = (224, 224, 3),
)
model(input_data)

[源代码]

from_preset 方法

VGGBackbone.from_preset(preset, load_weights=True, **kwargs)

从模型预设实例化一个 keras_hub.models.Backbone

预设是一个包含配置、权重和其他文件资源的目录,用于保存和加载预训练模型。preset 可以作为以下之一传递:

  1. 一个内置的预设标识符,如 'bert_base_en'
  2. 一个 Kaggle Models 句柄,如 'kaggle://user/bert/keras/bert_base_en'
  3. 一个 Hugging Face 句柄,如 'hf://user/bert_base_en'
  4. 一个 ModelScope 句柄,例如 'modelscope://user/bert_base_en'
  5. 一个本地预设目录的路径,如 './bert_base_en'

此构造函数可以通过两种方式之一调用。要么从基类调用,如 keras_hub.models.Backbone.from_preset(),要么从模型类调用,如 keras_hub.models.GemmaBackbone.from_preset()。如果从基类调用,则返回对象的子类将根据预设目录中的配置进行推断。

对于任何 Backbone 子类,您可以运行 cls.presets.keys() 来列出该类上所有可用的内置预设。

参数

  • preset:字符串。一个内置预设标识符、一个 Kaggle Models 句柄、一个 Hugging Face 句柄或一个本地目录的路径。
  • load_weights:布尔值。如果为 `True`,权重将被加载到模型架构中。如果为 `False`,权重将被随机初始化。

示例

# Load a Gemma backbone with pre-trained weights.
model = keras_hub.models.Backbone.from_preset(
    "gemma_2b_en",
)

# Load a Bert backbone with a pre-trained config and random weights.
model = keras_hub.models.Backbone.from_preset(
    "bert_base_en",
    load_weights=False,
)
预设 参数 描述
vgg_11_imagenet 9.22M 11 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。
vgg_13_imagenet 9.40M 13 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。
vgg_16_imagenet 14.71M 16 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。
vgg_19_imagenet 20.02M 19 层 VGG 模型,在 224x224 分辨率的 ImageNet 1k 数据集上预训练。