► Keras 2 API 文档 / 模型 API / 保存与序列化 / Model export for inference

用于推断的模型导出

`ExportArchive` 类

tf_keras.export.ExportArchive()

ExportArchive 用于写入 SavedModel 工件（例如用于推理）。

如果您有一个 TF-Keras 模型或层，您想将其导出为 SavedModel 以便服务（例如通过 TensorFlow-Serving），您可以使用 ExportArchive 来配置您需要提供的不同服务终端，以及它们的签名。只需实例化一个 ExportArchive，使用 track() 来注册要使用的层或模型，然后使用 add_endpoint() 方法注册一个新的服务终端。完成后，使用 write_out() 方法保存工件。

生成的工件是一个 SavedModel，可以通过 tf.saved_model.load 重新加载。

示例

以下是如何为推理导出模型。

export_archive = ExportArchive()
export_archive.track(model)
export_archive.add_endpoint(
    name="serve",
    fn=model.call,
    input_signature=[tf.TensorSpec(shape=(None, 3), dtype=tf.float32)],
)
export_archive.write_out("path/to/location")

# Elsewhere, we can reload the artifact and serve it.
# The endpoint we added is available as a method:
serving_model = tf.saved_model.load("path/to/location")
outputs = serving_model.serve(inputs)

以下是如何为推理导出一个具有一个终端的模型，以及一个用于训练模式前向传递（例如，带有 dropout 开启）的终端。

export_archive = ExportArchive()
export_archive.track(model)
export_archive.add_endpoint(
    name="call_inference",
    fn=lambda x: model.call(x, training=False),
    input_signature=[tf.TensorSpec(shape=(None, 3), dtype=tf.float32)],
)
export_archive.add_endpoint(
    name="call_training",
    fn=lambda x: model.call(x, training=True),
    input_signature=[tf.TensorSpec(shape=(None, 3), dtype=tf.float32)],
)
export_archive.write_out("path/to/location")

关于资源跟踪的说明

ExportArchive 能够自动跟踪其终端使用的所有 tf.Variables，因此在大多数情况下调用 .track(model) 并不是严格必需的。但是，如果您的模型使用了查找层，如 IntegerLookup、StringLookup 或 TextVectorization，则需要通过 .track(model) 显式跟踪它。

如果您需要能够访问恢复的工件上的 variables、trainable_variables 或 non_trainable_variables 属性，也需要显式跟踪。

用于推断的模型导出

ExportArchive 类

用于推断的模型导出

ExportArchive 类

`ExportArchive` 类