► KerasHub：预训练模型 / API文档 / KerasHub Tokenizers

KerasHub Tokenizers

Tokenizers 将原始字符串输入转换为适合 Keras Embedding 层的整数输入。它们也可以将预测的整数序列转换回原始字符串输出。

所有 tokenizer 都继承自 keras_hub.tokenizers.Tokenizer，而后者又继承自 keras.layers.Layer。Tokenizer 通常应该在训练时应用于 tf.data.Dataset.map 中，并可以在推理时包含在 keras.Model 中。

Tokenizer