FLAN T5

Source Code

FLAN T5는 paust/pko-t5-large 모델을 기반으로 다양한 태스크를 instruction finetuning을 통해서 만든 모델입니다.

현재 계속 Instruction Finetuning 을 진행하면서 중간결과를 모델로 업데이트하고 있습니다.

학습된 태스크

Task name Task type
NSMC Classification
Klue Ynat Classification
KorNLI Classification
KorSTS Classification
QuestionPair Classification
Klue STS Classification
AIHub news Summary Summarization
AIHub document Summary Summarization
AIHub book Summary Summarization
AIHub conversation Summary Summarization
AIHub ko-to-en Translation
AIHub ko-to-en Expert Translation
AIHub ko-to-en Tech Translation
AIHub ko-to-en social Translation
AIHub ko-to-jp Translation
AIHub ko-to-cn Tech Translation
AIHub Translation Corpus Translation
korquad QA
Klue MRC QA
AIHub mindslab's MRC QA

모델

사용 예시

from transformers import T5ForConditionalGeneration, T5TokenizerFast

tokenizer = T5TokenizerFast.from_pretrained('paust/pko-flan-t5-large')
model = T5ForConditionalGeneration.from_pretrained('paust/pko-flan-t5-large', device_map='cuda')

prompt = """서울특별시(서울特別市, 영어: Seoul Metropolitan Government)는 대한민국 수도이자 최대 도시이다. 선사시대부터 사람이 거주하였으나 본 역사는 백제 첫 수도 위례성을 시초로 한다. 삼국시대에는 전략적 요충지로서 고구려, 백제, 신라가 번갈아 차지하였으며, 고려 시대에는 왕실의 별궁이 세워진 남경(南京)으로 이름하였다.
한국의 수도는 어디입니까?"""
input_ids = tokenizer(prompt, add_special_tokens=True, return_tensors='pt').input_ids
output_ids = model.generate(input_ids=input_ids.cuda(), max_new_tokens=32, num_beams=12)
text = tokenizer.batch_decode(output_ids, skip_special_tokens=True)[0]
print(text)  # 서울특별시

License

PAUST에서 만든 pko-t5는 MIT license 하에 공개되어 있습니다.