stable-diffusion text-to-image stable-diffusion-diffusers diffusers

Manga Diffusion PoC Model Card

eyecatch.png

English: Click Here

はじめに

Manga Diffusion PoC (Proof-of-Concept) はAI Picasso社が作った漫画に特化した画像生成AIです。 Manga Diffusion PoC は 著作権者から許可された画像やパブリックドメインの画像、CC-0の画像だけで学習されています。

ライセンス

このモデルのライセンスは Mitsua Open RAIL-M License (More restrictive variant of CreativeML Open RAIL-M) です。 このモデルは商用利用可能ですが、"生成された画像をAIが生成したものではないと誤魔化すことはできません"。

使い方

ここからモデルをダウンロードできます。 Diffusersを使ってモデルをダウンロードすることもできます。

以下、一般的なモデルカードの日本語訳です。

モデル詳細

モデルの使用例

Stable Diffusion v2と同じ使い方です。 たくさんの方法がありますが、2つのパターンを提供します。

Web UIの場合

Stable Diffusion v2 の使い方と同じく、safetensor形式のモデルファイルをモデルフォルダに入れてください。 詳しいインストール方法は、こちらの記事を参照してください。

Diffusersの場合

🤗's Diffusers library を使ってください。

まずは、以下のスクリプトを実行し、ライブラリをいれてください。

pip install --upgrade git+https://github.com/huggingface/diffusers.git transformers accelerate scipy

次のスクリプトを実行し、画像を生成してください。

from diffusers import StableDiffusionPipeline, EulerAncestralDiscreteScheduler
import torch

model_id = "aipicasso/manga-diffusion-poc"

scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "monochrome, grayscale, tower"
images = pipe(prompt, num_inference_steps=30, height=512, width=768).images
images[0].save("tower.png")

注意:

想定される用途

想定されない用途

使用してはいけない用途や悪意のある用途

モデルの限界やバイアス

モデルの限界

バイアス

学習

学習データ

学習プロセス

評価結果

第三者による評価を求めています。

環境への影響

参考文献

@InProceedings{Rombach_2022_CVPR,
    author    = {Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bj\"orn},
    title     = {High-Resolution Image Synthesis With Latent Diffusion Models},
    booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
    month     = {June},
    year      = {2022},
    pages     = {10684-10695}
}

*このモデルカードは Stable Diffusion v2 に基づいて書かれました。