【SD1.5】初音ミク画像生成ベンチマーク¶
Diffusion Modelによる画像生成では下記のような要素を変更することで、簡単に生成結果を大きく変化させることができる。
- モデル, VAE(Variational Autoencoder)
- 追加学習(Textual Inversion)
- 追加学習(LoRA)
ここでは「初音ミク」を生成対象とし、要素を変えながらいくつか画像生成を行った結果を掲載する。
利用するもの一覧¶
- 描画対象
- 初音ミク(hatsune miku)
- モデル, VAE
- sd-v1-4
- AOM3, oramgemix.vae
- 追加学習(Textual Inversion)
- EasyNegative
- bad-hands-5
- 追加学習(LoRA)
- flat
生成方法¶
番号 | Model, VAE | 追加学習(Textual Inversion) | 追加学習(LoRA) |
---|---|---|---|
結果1 | sd-v1-4 | - | - |
結果2 | AOM3, oramgemix.vae | - | - |
結果3 | AOM3, oramgemix.vae | EasyNegative | - |
結果4 | AOM3, oramgemix.vae | EasyNegative, bad-hands-5 | flat |
生成結果¶
結果1¶
Text Only | |
---|---|
結果2¶
Text Only | |
---|---|
結果3¶
Text Only | |
---|---|
結果4¶
Text Only | |
---|---|
クレジット¶
これらのAI画像の作品はピアプロ・キャラクター・ライセンスに基づいてクリプトン・フューチャー・メディア株式会社のキャラクター「初音ミク」を描いたものである。