Magical2

This model is a fine-tuned version of crumb/gpt-joke on the None dataset. It achieves the following results on the evaluation set:

Loss: 1.5533

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 3e-05
train_batch_size: 30
eval_batch_size: 8
seed: 42
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: linear
num_epochs: 15

Training results

Training Loss	Epoch	Step	Validation Loss
No log	1.0	33	1.6553
No log	2.0	66	1.5406
No log	3.0	99	1.4875
No log	4.0	132	1.4571
No log	5.0	165	1.4472
No log	6.0	198	1.4450
No log	7.0	231	1.4522
No log	8.0	264	1.4694
No log	9.0	297	1.4754
No log	10.0	330	1.4947
No log	11.0	363	1.5067
No log	12.0	396	1.5227
No log	13.0	429	1.5341
No log	14.0	462	1.5436
No log	15.0	495	1.5533

Framework versions

Transformers 4.31.0
Pytorch 2.0.1+cu118
Datasets 2.14.3
Tokenizers 0.13.3

Magical2

Model description

Intended uses & limitations

Training and evaluation data

Training procedure

Training hyperparameters

Training results

Framework versions

NSDT 3DConvert

UnrealSynth

DreamTexture.js