分词器将原始字符串输入转换为适合Keras Embedding层的整数输入。它们还可以将预测的整数序列转换回原始字符串输出。
Embedding
所有分词器都是keras_hub.tokenizers.Tokenizer的子类,后者又是keras.layers.Layer的子类。分词器通常应用于训练的tf.data.Dataset.map中,并且可以在推理的keras.Model中包含。
keras_hub.tokenizers.Tokenizer
keras.layers.Layer
keras.Model