get_config
方法Model.get_config()
返回对象的配置。
对象配置是一个 Python 字典(可序列化),包含重新实例化该对象所需的信息。
from_config
方法Model.from_config(config, custom_objects=None)
根据配置创建操作。
此方法是 get_config
的反向操作,能够从配置字典实例化相同的操作。
注意:如果你覆盖此方法,可能会收到序列化的 dtype 配置,它是一个 dict
。你可以按如下方式反序列化它
if "dtype" in config and isinstance(config["dtype"], dict):
policy = dtype_policies.deserialize(config["dtype"])
参数
get_config
的输出。返回值
一个操作实例。
clone_model
函数keras.models.clone_model(
model,
input_tensors=None,
clone_function=None,
call_function=None,
recursive=False,
**kwargs
)
克隆 Functional 或 Sequential Model
实例。
模型克隆类似于在新的输入上调用模型,不同之处在于它创建新的层(以及新的权重),而不是共享现有层的权重。
请注意,clone_model
不会保留模型内共享对象的唯一性(例如,附加到两个不同层的单个变量将被恢复为两个独立的变量)。
参数
Model
实例(可以是 Functional 模型或 Sequential 模型)。Input
对象。fn(layer)
的可调用对象,用于克隆目标模型中的每个层(Input
实例除外)。它接收要克隆的层实例作为参数,并返回用于模型副本的相应层实例。如果未指定,则此可调用对象默认为以下序列化/反序列化函数:lambda layer: layer.__class__.from_config(layer.get_config())
。通过传入自定义的可调用对象,你可以自定义模型副本,例如通过包装某些感兴趣的层(例如,你可能希望将所有 LSTM
实例替换为等效的 Bidirectional(LSTM(...))
实例)。默认为 None
。fn(layer, *args, **kwargs)
的可调用对象,用于调用每个克隆的层和一组输入。它接收层实例、调用参数和关键字参数,并返回调用输出。如果未指定,则此可调用对象默认为常规的 __call__()
方法:def fn(layer, *args, **kwargs): return layer(*args, **kwargs)
。通过传入自定义的可调用对象,你可以在给定层之前或之后插入新层。注意:此参数只能与 Functional 模型一起使用。False
,则内部模型通过调用 clone_function()
进行克隆。如果为 True
,则内部模型通过调用 clone_model()
并使用相同的 clone_function
、call_function
和 recursive
参数进行克隆。请注意,在这种情况下,call_function
不会传播到任何 Sequential 模型(因为它不适用于 Sequential 模型)。返回值
一个 Model
实例,使用新实例化的权重在新输入张量之上重现原始模型的行为。如果自定义的 clone_function
或 call_function
修改了层或层调用,则克隆的模型行为可能与原始模型不同。
示例
# Create a test Sequential model.
model = keras.Sequential([
keras.layers.Input(shape=(728,)),
keras.layers.Dense(32, activation='relu'),
keras.layers.Dense(1, activation='sigmoid'),
])
# Create a copy of the test model (with freshly initialized weights).
new_model = clone_model(model)
使用 clone_function
通过在各处设置随机种子使模型具有确定性
def clone_function(layer):
config = layer.get_config()
if "seed" in config:
config["seed"] = 1337
return layer.__class__.from_config(config)
new_model = clone_model(model, clone_function=clone_function)
使用 call_function
在每个 Dense
层之后添加一个 Dropout
层(无需重新创建新层)
def call_function(layer, *args, **kwargs):
out = layer(*args, **kwargs)
if isinstance(layer, keras.layers.Dense):
out = keras.layers.Dropout(0.5)(out)
return out
new_model = clone_model(
model,
clone_function=lambda x: x, # Reuse the same layers.
call_function=call_function,
)
注意,子类模型默认无法克隆,因为其内部层结构未知。对于子类模型,要实现与 clone_model
等效的功能,只需确保模型类实现了 get_config()
(以及可选的 from_config()
),然后调用
new_model = model.__class__.from_config(model.get_config())
对于子类模型,你不能使用自定义的 clone_function
。