Keras 3 API 文档 / 模型 API / 模型类

模型类

[来源]

模型

keras.Model()

一个将层分组到具有训练/推理功能的对象中的模型。

有三种方法可以实例化一个 模型

使用“函数式 API”

您从 输入 开始,通过链接层调用来指定模型的正向传递,最后,您根据输入和输出创建模型

inputs = keras.Input(shape=(37,))
x = keras.layers.Dense(32, activation="relu")(inputs)
outputs = keras.layers.Dense(5, activation="softmax")(x)
model = keras.Model(inputs=inputs, outputs=outputs)

注意:仅支持输入张量的字典、列表和元组。不支持嵌套输入(例如,列表的列表或字典的字典)。

也可以通过使用中间张量来创建一个新的函数式 API 模型。这使您能够快速提取模型的子组件。

示例

inputs = keras.Input(shape=(None, None, 3))
processed = keras.layers.RandomCrop(width=128, height=128)(inputs)
conv = keras.layers.Conv2D(filters=32, kernel_size=3)(processed)
pooling = keras.layers.GlobalAveragePooling2D()(conv)
feature = keras.layers.Dense(10)(pooling)

full_model = keras.Model(inputs, feature)
backbone = keras.Model(processed, conv)
activations = keras.Model(conv, feature)

请注意,骨干激活 模型不是使用 keras.Input 对象创建的,而是使用源自 keras.Input 对象的张量创建的。在幕后,层和权重将在这些模型之间共享,以便用户可以训练 full_model,并使用 骨干激活 来进行特征提取。模型的输入和输出也可以是张量的嵌套结构,创建的模型是标准的函数式 API 模型,支持所有现有的 API。

通过子类化 模型

在这种情况下,您应该在 __init__() 中定义您的层,并且您应该在 call() 中实现模型的正向传递。

class MyModel(keras.Model):
    def __init__(self):
        super().__init__()
        self.dense1 = keras.layers.Dense(32, activation="relu")
        self.dense2 = keras.layers.Dense(5, activation="softmax")

    def call(self, inputs):
        x = self.dense1(inputs)
        return self.dense2(x)

model = MyModel()

如果您子类化 模型,您可以在 call() 中选择性地使用 训练 参数(布尔值),您可以使用它来指定训练和推理中的不同行为

class MyModel(keras.Model):
    def __init__(self):
        super().__init__()
        self.dense1 = keras.layers.Dense(32, activation="relu")
        self.dense2 = keras.layers.Dense(5, activation="softmax")
        self.dropout = keras.layers.Dropout(0.5)

    def call(self, inputs, training=False):
        x = self.dense1(inputs)
        x = self.dropout(x, training=training)
        return self.dense2(x)

model = MyModel()

创建模型后,可以使用 model.compile() 用损失和指标配置模型,使用 model.fit() 训练模型,或者使用模型使用 model.predict() 进行预测。

使用 顺序

此外,keras.Sequential 是模型的一种特殊情况,其中模型纯粹是单输入、单输出层的堆栈。

model = keras.Sequential([
    keras.Input(shape=(None, None, 3)),
    keras.layers.Conv2D(filters=32, kernel_size=3),
])

[来源]

摘要 方法

Model.summary(
    line_length=None,
    positions=None,
    print_fn=None,
    expand_nested=False,
    show_trainable=False,
    layer_range=None,
)

打印网络的字符串摘要。

参数

  • line_length:打印行的总长度(例如,将此设置为适应不同终端窗口大小的显示)。
  • positions:每行中日志元素的相对或绝对位置。如果未提供,则变为 [0.3, 0.6, 0.70, 1.]。默认为 None
  • print_fn:要使用的打印函数。默认情况下,打印到 stdout。如果 stdout 在您的环境中不起作用,请更改为 print。它将在摘要的每一行上被调用。您可以将其设置为自定义函数以捕获字符串摘要。
  • expand_nested:是否展开嵌套模型。默认为 False
  • show_trainable:是否显示层是否可训练。默认为 False
  • layer_range:包含 2 个字符串的列表或元组,它们是开始层名和结束层名(均包含在内),指示在摘要中打印的层范围。它也接受正则表达式模式而不是精确名称。在这种情况下,开始谓词将是与 layer_range[0] 匹配的第一个元素,结束谓词将是与 layer_range[1] 匹配的最后一个元素。默认情况下,None 考虑模型的所有层。

引发

  • ValueError:如果在构建模型之前调用 summary()

[来源]

get_layer 方法

Model.get_layer(name=None, index=None)

根据其名称(唯一)或索引检索层。

如果同时提供 nameindex,则 index 将优先。索引基于水平图遍历的顺序(自下而上)。

参数

  • name:字符串,层的名称。
  • index:整数,层的索引。

返回

一个层实例。