roberta tokenizer only

라이브러리 버전

Bingsu/ko_BBPE_tokenizer_roberta와 같은 방법으로 훈련한 토크나이저.

다만 unicode_normalizer="nfkc"를 뺐습니다.

tokenizer = ByteLevelBPETokenizer(trim_offsets=True)