if split_special_tokens==True，fast_tokenizer is slower than slow_tokenizer #1700

gongel · 2024-12-12T10:02:11Z

from transformers import LlamaTokenizer, LlamaTokenizerFast
import time
tokenizer1 = LlamaTokenizer.from_pretrained("./Llama-2-7b-chat-hf", split_special_tokens=True) # LlamaTokenizer
tokenizer2 = LlamaTokenizerFast.from_pretrained("./Llama-2-7b-chat-hf", split_special_tokens=True) # LlamaTokenizer
print(tokenizer1, tokenizer2)

s_time = time.time()
for i in range(1000):
    tokenizer1.tokenize("你好，where are you?"*100)
print(f"slow: {time.time() - s_time}")

s_time = time.time()
for i in range(1000):
    tokenizer2.tokenize("你好，where are you?"*100)
print(f"fast: {time.time() - s_time}")

output:
slow: 0.6021890640258789
fast: 0.7353882789611816

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

if split_special_tokens==True，fast_tokenizer is slower than slow_tokenizer #1700

if split_special_tokens==True，fast_tokenizer is slower than slow_tokenizer #1700

gongel commented Dec 12, 2024 •

edited

Loading

if split_special_tokens==True，fast_tokenizer is slower than slow_tokenizer #1700

if split_special_tokens==True，fast_tokenizer is slower than slow_tokenizer #1700

Comments

gongel commented Dec 12, 2024 • edited Loading

gongel commented Dec 12, 2024 •

edited

Loading