generated_from_trainer

<!-- This model card has been generated automatically according to the information the Trainer had access to. You should probably proofread and complete it, then remove this comment. -->

dolly_jp_rinna-gpt-1b-2023-05-16

rinna/japanese-gpt-1bをファインチューニングしたモデルです。 以下の日本語データセットを使ってモデルをファインチューニングしました。

モデルの読み込み

from transformers import T5Tokenizer, AutoModelForCausalLM

tokenizer = T5Tokenizer.from_pretrained("yulanfmy/dolly_jp_rinna-gpt-1b-2023-05-16")
model = AutoModelForCausalLM.from_pretrained("yulanfmy/dolly_jp_rinna-gpt-1b-2023-05-16")

学習コード

https://github.com/yulan-yan/dolly_jp

学習のハイパーパラメータ

トレーニングに使用したハイパーパラメータ:

ライブラリ