tokenizeNGram
NGramTokenizer