t5 text2text-generation seq2seq

回答と回答が出てくるパラグラフを与えると質問文を生成するモデル

SEE: https://github.com/sonoisa/deep-question-generation

本モデルの作成ステップ概要

  1. SQuAD 1.1を日本語に機械翻訳し、不正なデータをクレンジング(有効なデータは約半分)。
    回答が含まれるコンテキスト、質問文、解答の3つ組ができる。
  2. 日本語T5モデルを次の設定でファインチューニング