下から語彙を2500入れ替えたTokenizerと、mspで学習させたモデル