th-diffusion

このモデルは、SD2-1(768)からアニメスタイルの画像を学習させたものです。SDからアニメスタイルを自力で作ってみたかっただけです。学習方法はWD1-4とほとんど同じであり、データセットも学習ステップ数も負けてるので劣化版でしかないです。

diffusers用のとwebui用のsafetensorsを置いてます。

このモデルの学習は三段階に分かれます。

13万枚の画像を１０エポック学習:A100 80GBで20時間くらい
39万枚の画像をText endoderを含めて1エポック・含めずに追加で3エポック学習:RTX3090で80時間くらい
61万枚の画像を3エポック学習：RTX3090で100時間くらい

学習設定：

解像度 768×768を基準にしたAspect ratio bucketing.半分くらいが縦896横640です。
学習率 5e-6のconstant
batch size 1.は20 2.3.は16
タグ　WD1-4taggerを利用しました。

2.3.はWD1-4のタグ付け規則に従っています。そのため機能するプロンプトやネガティブプロンプトはWD1-4と変わりません。

右にある変な奴で試せますが、ネガティブプロンプトがないのであんまりいい画像はでないよ。

生成例

てきとう、ネガティブプロンプトはworst quality, low quality, medium quality, deleted, lowres, comic, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, blurry

CFG_scaleは10、高めにしたほうがいいかも。

masterpiece,best quality,1girl,solo,sitting,blush,red eyes,blonde hair,twintails,hair ribbon,school uniform,blue sailor collar,blue skirt,black thighhighs masterpiece,best quality,absurdres,safe,1girl,solo,one eye closed, brown hair, side ponytail, maid, maid headdress, white thighhighs masterpiece,best quality,hakurei reimu,touhou,solo,blush,brown hair,red eyes,frills,navel , yellow ascot, detached sleeves,hair bow,hair tubes

th-diffusion

生成例

NSDT 3DConvert

UnrealSynth

DreamTexture.js