megemini/shanshui_gen_style - 当中国水墨山水画遇上AIGC - Chinese ink-wash landscape painting meets AIGC
本仓库的模型采用 Textual inversion 技术并使用 style 进行训练。
预训练模型为 runwayml/stable-diffusion-v1-5 ,训练的图片来自于由模型的 img2img 根据中国水墨山水画生成的图片。
runwayml/stable-diffusion-v1-5 模型根据中国水墨山水画可以生成有意境又具像的图片,而利用这些生成的图片再次训练的模型,可以利用文本在不使用水墨画的基础上就生成相似的图片。
👉 megemini/shanshui 这个应用便是利用了上述模型。
看一下原模型 runwayml/stable-diffusion-v1-5 与此模型在相似 prompt 下生成的图片:
| image | model | prompt |
|---|---|---|
![]() |
runwayml/stable-diffusion-v1-5 | A fantasy landscape |
![]() |
runwayml/stable-diffusion-v1-5 | A fantasy landscape |
![]() |
runwayml/stable-diffusion-v1-5 | A fantasy landscape |
![]() |
megemini/shanshui_gen_style | A fantasy landscape in <shanshui-gen-style> |
![]() |
megemini/shanshui_gen_style | A fantasy landscape in <shanshui-gen-style> |
![]() |
megemini/shanshui_gen_style | A fantasy landscape in <shanshui-gen-style> |
新模型对比预训练模型,生成的图片风格相近,但是山峰的比例更多,层次也更丰富。
下面是用于此模型训练的部分数据图样:
| 原画 | 生成(并用于此模型的训练) | prompt |
|---|---|---|
![]() |
![]() |
A fantasy landscape |
![]() |
![]() |
A fantasy landscape |
![]() |
![]() |
A fantasy landscape |
![]() |
![]() |
A fantasy landscape |
![]() |
![]() |
A fantasy landscape, trending on artstation |
P.S. 👉 megemini/shanshui_style 这个模型可以生成中国水墨山水画风的图片。















