한국인 이름 인식 모델
kor-bert fine-tuning 모델
자주 안쓰는 한글이름 기준으로 생성기를 만들어서, 16만개의 한글 이름을 생성 후 학습한 모델입니다.
ex) 안녕하세요. 임준영입니다. -> 안녕하세요. ***입니다.
from transformers import BertTokenizerFast, BertForTokenClassification
from transformers import pipeline
model_name = 'joon09/kor-naver-ner-name'
tokenizer = BertTokenizerFast.from_pretrained(model_name)
model = BertForTokenClassification.from_pretrained(model_name)
nlp = pipeline("ner", model=model, tokenizer=tokenizer)
ner('안녕하세요. 임준영입니다.',grouped_entities=True,aggregation_strategy='average')
[{'entity_group': 'PER',
'score': 0.99999785,
'word': '임',
'start': 7,
'end': 8},
{'entity_group': 'PER',
'score': 0.82035744,
'word': '##준영',
'start': 8,
'end': 10}]