► Keras 3 API 文档 / 层 API / 后端特定层 / JaxLayer

JaxLayer

`JaxLayer` 类

keras.layers.JaxLayer(
    call_fn, init_fn=None, params=None, state=None, seed=None, **kwargs
)

封装 JAX 模型的 Keras 层。

当使用 JAX 作为 Keras 的后端时，此层支持在 Keras 中使用 JAX 组件。

模型函数

此层接受 JAX 模型，其形式为 call_fn 函数，该函数必须接受以下参数，且名称必须完全匹配：

params：模型的训练参数。
state（可选）：模型的非训练状态。如果模型没有非训练状态，则可以省略。
rng（可选）：一个 jax.random.PRNGKey 实例。如果模型在训练或推理时不需要 RNG，则可以省略。
inputs：模型的输入，一个 JAX 数组或一个数组的 PyTree。
training（可选）：一个指定我们处于训练模式还是推理模式的参数，在训练模式下传递 True。如果模型在训练模式和推理模式下的行为相同，则可以省略。

inputs 参数是强制的。必须通过单个参数提供模型的输入。如果 JAX 模型以单独的参数接受多个输入，则必须将它们组合成单个结构，例如在 tuple 或 dict 中。

模型权重初始化

模型 params 和 state 的初始化可以由此层处理，在这种情况下必须提供 init_fn 参数。这允许模型根据正确的形状动态初始化。或者，如果形状已知，则可以使用 params 参数和可选的 state 参数来创建已初始化的模型。

init_fn 函数（如果提供）必须接受以下参数，且名称必须完全匹配：

rng：一个 jax.random.PRNGKey 实例。
inputs：一个 JAX 数组或一个具有占位符值的数组的 PyTree，用于提供输入的形状。
training（可选）：一个指定我们处于训练模式还是推理模式的参数。True 始终传递给 init_fn。无论 call_fn 是否有 training 参数，都可以省略。

具有非训练状态的模型

对于具有非训练状态的 JAX 模型：

call_fn 必须有一个 state 参数。
call_fn 必须返回一个包含模型输出和模型新的非训练状态的 tuple。
init_fn 必须返回一个包含模型初始训练参数和模型初始非训练状态的 tuple。

此代码展示了具有非训练状态的模型 call_fn 和 init_fn 签名的可能组合。在此示例中，模型在 call_fn 中有一个 training 参数和一个 rng 参数。

def stateful_call(params, state, rng, inputs, training):
    outputs = ...
    new_state = ...
    return outputs, new_state

def stateful_init(rng, inputs):
    initial_params = ...
    initial_state = ...
    return initial_params, initial_state

没有非训练状态的模型

对于没有非训练状态的 JAX 模型：

call_fn 不能有 state 参数。
call_fn 必须仅返回模型的输出。
init_fn 必须仅返回模型的初始训练参数。

此代码展示了没有非训练状态的模型 call_fn 和 init_fn 签名的可能组合。在此示例中，模型在 call_fn 中没有 training 参数，也没有 rng 参数。

def stateless_call(params, inputs):
    outputs = ...
    return outputs

def stateless_init(rng, inputs):
    initial_params = ...
    return initial_params

符合必需签名

如果模型具有与 JaxLayer 所需签名不同的签名，则可以轻松编写包装器方法来适配参数。此示例展示了一个模型，该模型具有作为单独参数的多个输入，期望 dict 中的多个 RNG，并且有一个含义与 training 相反的 deterministic 参数。为了符合要求，输入使用 tuple 组合成单个结构，RNG 被拆分并用于填充预期的 dict，并且布尔标志被取反。

def my_model_fn(params, rngs, input1, input2, deterministic):
    ...
    if not deterministic:
        dropout_rng = rngs["dropout"]
        keep = jax.random.bernoulli(dropout_rng, dropout_rate, x.shape)
        x = jax.numpy.where(keep, x / dropout_rate, 0)
        ...
    ...
    return outputs

def my_model_wrapper_fn(params, rng, inputs, training):
    input1, input2 = inputs
    rng1, rng2 = jax.random.split(rng)
    rngs = {"dropout": rng1, "preprocessing": rng2}
    deterministic = not training
    return my_model_fn(params, rngs, input1, input2, deterministic)

keras_layer = JaxLayer(my_model_wrapper_fn, params=initial_params)

与 Haiku 模块一起使用

JaxLayer 支持使用 Haiku 组件，形式为 haiku.Module。这通过根据 Haiku 模式转换模块，然后如果需要，在 call_fn 参数中传递 module.apply，在 init_fn 参数中传递 module.init 来实现。

如果模型具有非训练状态，则应使用 haiku.transform_with_state 进行转换。如果模型没有非训练状态，则应使用 haiku.transform 进行转换。此外，如果模块在“apply”中不使用 RNG，还可以选择使用 haiku.without_apply_rng 进行转换。

以下示例展示了如何从使用通过 hk.next_rng_key() 进行的随机数生成器并接受训练位置参数的 Haiku 模块创建 JaxLayer。

class MyHaikuModule(hk.Module):
    def __call__(self, x, training):
        x = hk.Conv2D(32, (3, 3))(x)
        x = jax.nn.relu(x)
        x = hk.AvgPool((1, 2, 2, 1), (1, 2, 2, 1), "VALID")(x)
        x = hk.Flatten()(x)
        x = hk.Linear(200)(x)
        if training:
            x = hk.dropout(rng=hk.next_rng_key(), rate=0.3, x=x)
        x = jax.nn.relu(x)
        x = hk.Linear(10)(x)
        x = jax.nn.softmax(x)
        return x

def my_haiku_module_fn(inputs, training):
    module = MyHaikuModule()
    return module(inputs, training)

transformed_module = hk.transform(my_haiku_module_fn)

keras_layer = JaxLayer(
    call_fn=transformed_module.apply,
    init_fn=transformed_module.init,
)

参数

call_fn：调用模型的函数。有关它接受的参数和返回的输出的列表，请参见上文。init_fn：用于初始化模型的函数。有关它接受的参数和返回的输出的列表，请参见上文。如果为 None，则必须提供 params 和/或 state。
params：一个包含所有模型训练参数的 PyTree。这允许传递训练好的参数或控制初始化。如果 params 和 state 均为 None，则在构建时会调用 init_fn 来初始化模型的训练参数。
state：一个包含所有模型非训练状态的 PyTree。这允许传递学习到的状态或控制初始化。如果 params 和 state 均为 None，并且 call_fn 接受 state 参数，则在构建时会调用 init_fn 来初始化模型的非训练状态。
seed：随机数生成器的种子。可选。
dtype：层计算和权重的 dtype。也可以是 keras.DTypePolicy。可选。默认为默认策略。

JaxLayer

JaxLayer 类

模型函数

模型权重初始化

具有非训练状态的模型

没有非训练状态的模型

符合必需签名

与 Haiku 模块一起使用

JaxLayer

JaxLayer 类

模型函数

模型权重初始化

具有非训练状态的模型

没有非训练状态的模型

符合必需签名

与 Haiku 模块一起使用

`JaxLayer` 类