► KerasHub: 预训练模型 / API文档 / 模型架构 / Segment Anything Model / SAMImageSegmenter 模型

SAMImageSegmenter 模型

`SAMImageSegmenter` 类

keras_hub.models.SAMImageSegmenter(backbone, preprocessor=None, **kwargs)

Segment Anything (SAM) 图像分割模型。

SAM通过对输入图像进行提示来工作。有三种提示方式：(1) 标记点：前景点（标签为1的点）被编码，使得由掩码解码器生成的掩码包含它们；背景点（标签为0的点）被编码，使得生成的掩码不包含它们。(2) 边界框：边界框告诉模型要分割图像的哪个部分/区域。(3) 掩码：输入掩码可用于精炼掩码解码器的输出。这些提示可以组合使用，但至少需要提供一种提示。要禁用特定提示，只需将其从模型输入中排除。(1) 对于点提示，预期的形状是(batch, num_points, 2)。标签必须具有相应的形状(batch, num_points)。(2) 对于边界框提示，预期的形状是(batch, 1, 2, 2)。(3) 类似地，掩码提示的形状是(batch, 1, H, W, 1)。

参数

backbone: 一个 keras_hub.models.SAMBackbone 实例。

示例

使用from_preset加载预训练模型。

image_size=128
batch_size=2
input_data = {
    "images": np.ones(
        (batch_size, image_size, image_size, 3),
        dtype="float32",
    ),
    "points": np.ones((batch_size, 1, 2), dtype="float32"),
    "labels": np.ones((batch_size, 1), dtype="float32"),
    "boxes": np.ones((batch_size, 1, 2, 2), dtype="float32"),
    "masks": np.zeros(
        (batch_size, 0, image_size, image_size, 1)
    ),
}
sam = keras_hub.models.SAMImageSegmenter.from_preset('sam_base_sa1b')
outputs = sam.predict(input_data)
masks, iou_pred = outputs["masks"], outputs["iou_pred"]

加载具有自定义骨干网络的Segment Anything图像分割器

image_size = 128
batch_size = 2
images = np.ones(
    (batch_size, image_size, image_size, 3),
    dtype="float32",
)
image_encoder = keras_hub.models.ViTDetBackbone(
    hidden_size=16,
    num_layers=16,
    intermediate_dim=16 * 4,
    num_heads=16,
    global_attention_layer_indices=[2, 5, 8, 11],
    patch_size=16,
    num_output_channels=8,
    window_size=2,
    image_shape=(image_size, image_size, 3),
)
prompt_encoder = keras_hub.layers.SAMPromptEncoder(
    hidden_size=8,
    image_embedding_size=(8, 8),
    input_image_size=(
        image_size,
        image_size,
    ),
    mask_in_channels=16,
)
mask_decoder = keras_hub.layers.SAMMaskDecoder(
    num_layers=2,
    hidden_size=8,
    intermediate_dim=32,
    num_heads=8,
    embedding_dim=8,
    num_multimask_outputs=3,
    iou_head_depth=3,
    iou_head_hidden_dim=8,
)
backbone = keras_hub.models.SAMBackbone(
    image_encoder=image_encoder,
    prompt_encoder=prompt_encoder,
    mask_decoder=mask_decoder,
)
sam = keras_hub.models.SAMImageSegmenter(
    backbone=backbone
)

例如，要传入所有提示，请执行以下操作

points = np.array([[[512., 512.], [100., 100.]]])
# For labels: 1 means foreground point, 0 means background
labels = np.array([[1., 0.]])
box = np.array([[[[384., 384.], [640., 640.]]]])
input_mask = np.ones((1, 1, 256, 256, 1))
# Prepare an input dictionary:
inputs = {
    "images": image,
    "points": points,
    "labels": labels,
    "boxes": box,
    "masks": input_mask
}
outputs = sam.predict(inputs)
masks, iou_pred = outputs["masks"], outputs["iou_pred"]

输出masks中的第一个掩码（即masks[:, 0, ...]）是模型根据提示预测的最佳掩码。其他masks（即masks[:, 1:, ...]）是备选预测，如果它们比第一个更受欢迎，则可以使用。现在，在只有点和边界框提示的情况下，只需排除掩码

inputs = {
    "images": image,
    "points": points,
    "labels": labels,
    "boxes": box,
}

outputs = sam.predict(inputs)
masks, iou_pred = outputs["masks"], outputs["iou_pred"]

另一个例子是只存在点提示。请注意，如果存在点提示但不存在边界框提示，则必须使用零点和-1标签来填充点

padded_points = np.concatenate(
    [points, np.zeros((1, 1, 2))], axis=1
)

padded_labels = np.concatenate(
    [labels, -np.ones((1, 1))], axis=1
)
inputs = {
    "images": image,
    "points": padded_points,
    "labels": padded_labels,
}
outputs = sam.predict(inputs)
masks, iou_pred = outputs["masks"], outputs["iou_pred"]

[源代码]

`from_preset` 方法

SAMImageSegmenter.from_preset(preset, load_weights=True, **kwargs)

从模型预设实例化一个 keras_hub.models.Task。

预设是一个包含配置、权重和其他文件资产的目录，用于保存和加载预训练模型。preset 可以作为以下之一传递：

一个内置的预设标识符，如 'bert_base_en'
一个 Kaggle Models 句柄，如 'kaggle://user/bert/keras/bert_base_en'
一个 Hugging Face 句柄，如 'hf://user/bert_base_en'
一个本地预设目录的路径，如 './bert_base_en'

对于任何 Task 子类，您都可以运行 cls.presets.keys() 来列出该类上所有可用的内置预设。

此构造函数可以通过两种方式调用。一种方式是从特定任务的基类（如 keras_hub.models.CausalLM.from_preset()）调用，另一种方式是从模型类（如 keras_hub.models.BertTextClassifier.from_preset()）调用。如果从基类调用，返回对象的子类将从预设目录中的配置推断出来。

参数

preset：字符串。一个内置预设标识符、一个 Kaggle Models 句柄、一个 Hugging Face 句柄或一个本地目录的路径。
load_weights: 布尔值。如果为 True，已保存的权重将被加载到模型架构中。如果为 False，所有权重将被随机初始化。

示例

# Load a Gemma generative task.
causal_lm = keras_hub.models.CausalLM.from_preset(
    "gemma_2b_en",
)

# Load a Bert classification task.
model = keras_hub.models.TextClassifier.from_preset(
    "bert_base_en",
    num_classes=2,
)

预设	参数	描述
sam_base_sa1b	93.74M	在 SA1B 数据集上训练的基础 SAM 模型。
sam_huge_sa1b	312.34M	在 SA1B 数据集上训练的巨型 SAM 模型。
sam_large_sa1b	641.09M	在 SA1B 数据集上训练的大型 SAM 模型。

`backbone` 属性

keras_hub.models.SAMImageSegmenter.backbone

一个具有核心架构的 keras_hub.models.Backbone 模型。

`preprocessor` 属性

keras_hub.models.SAMImageSegmenter.preprocessor

用于预处理输入的 keras_hub.models.Preprocessor 层。

SAMImageSegmenter 模型

SAMImageSegmenter 类

from_preset 方法

backbone 属性

preprocessor 属性

SAMImageSegmenter 模型

SAMImageSegmenter 类

from_preset 方法

backbone 属性

preprocessor 属性

`SAMImageSegmenter` 类

`from_preset` 方法

`backbone` 属性

`preprocessor` 属性