コンテンツにスキップ

【SD1.5】初音ミク画像生成ベンチマーク

Diffusion Modelによる画像生成では下記のような要素を変更することで、簡単に生成結果を大きく変化させることができる。

  • モデル, VAE(Variational Autoencoder)
  • 追加学習(Textual Inversion)
  • 追加学習(LoRA)

ここでは「初音ミク」を生成対象とし、要素を変えながらいくつか画像生成を行った結果を掲載する。

利用するもの一覧

  • 描画対象
    • 初音ミク(hatsune miku)
  • モデル, VAE
    • sd-v1-4
    • AOM3, oramgemix.vae
  • 追加学習(Textual Inversion)
    • EasyNegative
    • bad-hands-5
  • 追加学習(LoRA)
    • flat

生成方法

番号 Model, VAE 追加学習(Textual Inversion) 追加学習(LoRA)
結果1 sd-v1-4 - -
結果2 AOM3, oramgemix.vae - -
結果3 AOM3, oramgemix.vae EasyNegative -
結果4 AOM3, oramgemix.vae EasyNegative, bad-hands-5 flat

生成結果

結果1

Text Only
hatsune miku
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 3272356495, Size: 512x768, Model hash: fe4efff1e1, Model: sd-v1-4, Clip skip: 2

結果2

Text Only
hatsune miku
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 1477562008, Size: 512x768, Model hash: d124fc18f0, Model: AOM3, Clip skip: 2

結果3

Text Only
1
2
3
hatsune miku
Negative prompt: EasyNegative
Steps: 30, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 534580541, Size: 512x768, Model hash: d124fc18f0, Model: AOM3, Clip skip: 2

結果4

Text Only
1
2
3
<lora:flat2:-1>, hatsune miku
Negative prompt: EasyNegative, bad-hands-5
Steps: 30, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 673866072, Size: 512x768, Model hash: d124fc18f0, Model: AOM3, Clip skip: 2

クレジット

これらのAI画像の作品はピアプロ・キャラクター・ライセンスに基づいてクリプトン・フューチャー・メディア株式会社のキャラクター「初音ミク」を描いたものである。