【SDXL】矢吹風Loraモデル¶

2024年1月時点で、SDXLが利用可能になって暫く経ち、追加学習モデルがいくつか公開されるようになった。
先日(24/1/24)、矢吹健太朗先生のSDXL用作風Loraモデルが公開されており、作風モデルについてレポートする題材としていくつか生成してみたいと思う。

主な利用モデル¶

civitaiのLoraモデルの生成例を参考にパラメータ設定する
- 各画像ページのCopy Generation Dataからより詳細な設定情報を得ることができる
生成結果を見てこのあたり適当に微調整していく
- Sampling steps : ステップ数
- CFG Scale : プロントへの忠実度
- hires. fix
  - Hires steps : 高解像度化する際のステップ数（0の時sampling stepsと同じになる）
  - Denoising strength : ノイズ除去強度
Hires. fix をかけてFHDにupscaleする
- ControlNet Tile の正式版モデルは執筆時点ではなさそう。軽く試した範囲だとまだ微妙なところだったので今後に期待。

SD1.5の世代に比べると画風再現度が高くなった印象を受ける。再現生成においてはNovelAIが優秀であるが、SDXLも十分選択肢に入るだろう。
SD1.5 + 高解像度化の世代に比べると高解像度前から画像の解像度が高いからか、指などが破綻しにくい傾向がある。SDXLにおけるFHD化の手段がもっと確立していき次第色々とまた試してみたいところ。
- hires fix
  - 1440 × 2160 を作成
  - 1.5〜2倍以内ぐらいが結果が安定しやすい感触
    - (960 × 1440) * 1.5
    - （720 × 1080）* 2
1440 × 2160 に hires fix で upscale しているが、RTX4090のGPUメモリ利用率が23.5/23.6426 GB (99.4%)でかなりギリギリ
- ~~Xformersが機能していないかも？~~
- 環境更新してxformer設定しても23GBは使うのでこの方法での物理的限界の模様
trigger wordsにないキャラクターはちょっと安定しない。Loraかアップデートほしい。
特定のキャラクターを作っているとだんだんゲシュタルト崩壊してくる
ずんだもんの触角？がよく消えてしまう。