分词器将原始字符串输入转换为适合 Keras Embedding 层的整数输入。它们还可以将预测的整数序列转换回原始字符串输出。
Embedding
所有分词器都是 keras_nlp.tokenizers.Tokenizer 的子类,后者又是 keras.layers.Layer 的子类。分词器通常应在训练期间应用于 tf.data.Dataset.map 内,并且可以在推理期间包含在 keras.Model 内。
keras_nlp.tokenizers.Tokenizer
keras.layers.Layer
keras.Model